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INTRODUCCION 



iQue es Python? 

Python es un lenguaje de programacion creado por Guido van Rossum 
a principios de los anos 90 cuyo nombre esta inspirado en el grupo de 
comicos ingleses "Monty Python". Es un lenguaje similar a Perl, pero 
con una sintaxis muy limpia y que favorece un codigo legible. 

Se trata de un lenguaje interpretado o de script, con tipado dinamico, 
fuertemente tipado, multiplataforma y orientado a objetos. 

Lenguaje interpretado o de script 

Un lenguaje interpretado o de script es aquel que se ejecuta utilizando 
un programa intermedio llamado interprete, en lugar de compilar el 
codigo a lenguaje maquina que pueda comprender y ejecutar directa- 
mente una computadora (lenguajes compilados). 

La ventaja de los lenguajes compilados es que su ejecucion es mas 
rapida. Sin embargo los lenguajes interpretados son mas flexibles y mas 
portables. 

Python tiene, no obstante, muchas de las caracteristicas de los lengua- 
jes compilados, por lo que se podria decir que es semi interpretado. En 
Python, como en Java y muchos otros lenguajes, el codigo fuente se 
traduce a un pseudo codigo maquina intermedio llamado bytecode la 
primera vez que se ejecuta, generando archivos .pyc o .pyo (bytecode 
optimizado), que son los que se ejecutaran en sucesivas ocasiones. 

Tipado dinamico 

La caracteristica de tipado dinamico se refiere a que no es necesario 
declarar el tipo de dato que va a contener una determinada variable, 



7 



Python para todos 



sino que su tipo se determinant en tiempo de ejecucion segun el tipo 
del valor al que se asigne, y el tipo de esta variable puede cambiar si se 
le asigna un valor de otro tipo. 

Fuertemente tipado 

No se permite tratar a una variable como si fuera de un tipo distinto 
al que tiene, es necesario convertir de forma expli'cita dicha variable 
al nuevo tipo previamente. Por ejemplo, si tenemos una variable que 
contiene un texto (variable de tipo cadena o string) no podremos tra- 
tarla como un numero (sumar la cadena "9" y el numero 8). En otros 
lenguajes el tipo de la variable cambiaria para adaptarse al comporta- 
miento esperado, aunque esto es mas propenso a errores. 

Multiplataforma 

El interprete de Python esta disponible en multitud de plataformas 
(UNIX, Solaris, Linux, DOS, Windows, OS/2, Mac OS, etc.) por lo 
que si no utilizamos librerias espedficas de cada plataforma nuestro 
programa podra correr en todos estos sistemas sin grandes cambios. 

Orientado a objetos 

La orientation a objetos es un paradigma de programacion en el que 
los conceptos del mundo real relevantes para nuestro problema se tras- 
ladan a clases y objetos en nuestro programa. La ejecucion del progra- 
ma consiste en una serie de interacciones entre los objetos. 

Python tambien permite la programacion imperativa, programacion 
funcional y programacion orientada a aspectos. 

£Por que Python? 

Python es un lenguaje que todo el mundo deberia conocer. Su sintaxis 
simple, clara y sencilla; el tipado dinamico, el gestor de memoria, la 
gran cantidad de librerias disponibles y la potencia del lenguaje, entre 
otros, hacen que desarrollar una aplicacion en Python sea sencillo, muy 
rapido y, lo que es mas importante, divertido. 

La sintaxis de Python es tan sencilla y cercana al lenguaje natural que 
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los programas elaborados en Python parecen pseudocodigo. Por este 
motivo se trata ademas de uno de los mejores lenguajes para comenzar 
a programar. 

Python no es adecuado sin embargo para la programacion de bajo 
nivel o para aplicaciones en las que el rendimiento sea critico. 

Algunos casos de exito en el uso de Python son Google, Yahoo, la 
NASA, Industrias Light & Magic, y todas las distribuciones Linux, en 
las que Python cada vez representa un tanto por ciento mayor de los 
programas disponibles. 

Instalacion de Python 

Existen varias implementaciones distintas de Python: CPython, 
Jython, IronPython, PyPy, etc. 

CPython es la mas utilizada, la mas rapida y la mas madura. Cuando la 
gente habla de Python normalmente se refiere a esta implementation. 
En este caso tanto el interprete como los modulos estan escritos en C. 

Jython es la implementation en Java de Python, mientras que 
IronPython es su contrapartida en C# (.NET). Su interes estriba en 
que utilizando estas implementaciones se pueden utilizar todas las 
librerias disponibles para los programadores de Java y .NET. 

PyPy, por ultimo, como habreis adivinado por el nombre, se trata de 
una implementation en Python de Python. 

CPython esta instalado por defecto en la mayor parte de las distribu- 
ciones Linux y en las ultimas versiones de Mac OS. Para comprobar si 
esta instalado abre una terminal y escribe python. Si esta instalado se 
iniciara la consola interactiva de Python y obtendremos parecido a lo 
siguiente: 

Python 2.5.1 (r251 : 54863 , May 2 2007, 16:56:35) 

[GCC 4.1.2 (Ubuntu 4. 1 . 2-0ubuntu4) ] on linux2 

Type "help", "copyright", "credits" or "license" for more 

information. 

>>> 
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La primera lmea nos indica la version de Python que tenemos ins- 
talada. Al final podemos ver el prompt (»>) que nos indica que el 
interprete esta esperando codigo del usuario. Podemos salir escribiendo 
exit( ), o pulsando Control + D. 

Si no te muestra algo parecido no te preocupes, instalar Python es muy 
sencillo. Puedes descargar la version correspondiente a tu sistema ope- 
rativo desde la web de Python, en http://www.python.org/download/. 
Existen instaladores para Windows y Mac OS. Si utilizas Linux es 
muy probable que puedas instalarlo usando la herramienta de gestion 
de paquetes de tu distribution, aunque tambien podemos descargar la 
aplicacion compilada desde la web de Python. 

Herramientas basicas 

Existen dos formas de ejecutar codigo Python. Podemos escribir lineas 
de codigo en el interprete y obtener una respuesta del interprete para 
cada lmea (sesion interactiva) o bien podemos escribir el codigo de un 
programa en un archivo de texto y ejecutarlo. 

A la hora de realizar una sesion interactiva os aconsejo instalar y uti- 
lizar iPython, en lugar de la consola interactiva de Python. Se puede 
encontrar en http://ipython.scipy.org/. iPython cuenta con caracteristicas 
anadidas muy interesantes, como el autocompletado o el operador ?. 
(para activar la caracteristica de autocompletado en Windows es nece- 
sario instalar PyReadline, que puede descargarse desde http.Z/ipython. 
scipy. org/ moin/PyReadline/Intro) 

La funcion de autocompletado se lanza pulsando el tabulador. Si 
escribimos f i y pulsamos Tab nos mostrara una lista de los objetos 
que comienzan con fi (file, filter y finally). Si escribimos f ile. y 
pulsamos Tab nos mostrara una lista de los metodos y propiedades del 
objeto file. 

El operador ? nos muestra informacion sobre los objetos. Se utiliza 
anadiendo el simbolo de interrogation al final del nombre del objeto 
del cual queremos mas informacion. Por ejemplo: 

In [3]: str? 
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Type: type 
Base Class: 
String Form: 

Namespace: Python builtin 
Docstring : 

str(object) -> string 

Return a nice string representation of the object. 

If the argument is a string, the return value is the same 

object . 

En el campo de IDEs y editores de codigo gratuitos PyDEV (http:// 
pydev.sourceforge.net/) se alza como cabeza de serie. PyDEV es un plu- 
gin para Eclipse que permite utilizar este IDE multiplataforma para 
programar en Python. Cuenta con autocompletado de codigo (con 
information sobre cada elemento), resaltado de sintaxis, un depurador 
grafico, resaltado de errores, explorador de clases, formateo del codigo, 
refactorizacion, etc. Sin duda es la option mas completa, sobre todo si 
instalamos las extensiones comerciales, aunque necesita de una canti- 
dad importante de memoria y no es del todo estable. 

Otras opciones gratuitas a considerar son SPE o Stani's Python Editor 

(http://sourceforge. net/projects/spe/) , Eric {http://die-offenbachs. de/eric/) , 
BOA Constructor {http://boa-constructor.sourceforge.net/) o incluso 
emacs o vim. 

Si no te importa desembolsar algo de dinero, Komodo {fittp://www. 
activestate.com/komodo_ide/) yWing IDE (http://www.wingware.com/) 
son tambien muy buenas opciones, con montones de caracteristicas 
interesantes, como PyDEV, pero mucho mas estables y robustos. Ade- 
mas, si desarrollas software libre no comercial puedes contactar con 
Wing Ware y obtener, con un poco de suerte, una licencia gratuita para 
Wing IDE Professional :) 
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PYTHON 



Como comentabamos en el capitulo anterior existen dos formas de 
ejecutar codigo Python, bien en una sesion interactiva (li'nea a h'nea) 
con el interprete, o bien de la forma habitual, escribiendo el codigo en 
un archivo de codigo fuente y ejecutandolo. 

El primer programa que vamos a escribir en Python es el clasico Hola 
Mundo, y en este lenguaje es tan simple como: 

print "Hola Mundo" 

Vamos a probarlo primero en el interprete. Ejecuta python o ipython 
segun tus preferencias, escribe la h'nea anterior y pulsa Enter. El inter- 
prete respondent mostrando en la consola el texto Hola Mundo. 

Vamos ahora a crear un archivo de texto con el codigo anterior, de 
forma que pudieramos distribuir nuestro pequeno gran programa entre 
nuestros amigos. Abre tu editor de texto preferido o bien el IDE que 
hayas elegido y copia la h'nea anterior. Guardalo como hola.py, por 
ejemplo. 

Ejecutar este programa es tan sencillo como indicarle el nombre del 
archivo a ejecutar al interprete de Python 

python hola.py 
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pero vamos a ver como simplificarlo aun mas. 

Si utilizas Windows los archivos .py ya estaran asociados al interprete 
de Python, por lo que basta hacer doble clic sobre el archivo para eje- 
cutar el programa. Sin embargo como este programa no hace mas que 
imprimir un texto en la consola, la ejecucion es demasiado rapida para 
poder verlo si quiera. Para remediarlo, vamos a afiadir una nueva li'nea 
que espere la entrada de datos por parte del usuario. 

print "Hola Mundo" 
raw_input( ) 

De esta forma se mostrara una consola con el texto Hola Mundo hasta 
que pulsemos Enter. 

Si utilizas Linux (u otro Unix) para conseguir este comportamiento, es 
decir, para que el sistema operativo abra el archivo .py con el interprete 
adecuado, es necesario afiadir una nueva li'nea al principio del archivo: 

#! /usr/bin/python 
print "Hola Mundo" 
raw_input( ) 

A esta linea se le conoce en el mundo Unix como shebang, hashbang 
o sharpbang. El par de caracteres # ! indica al sistema operativo que 
dicho script se debe ejecutar utilizando el interprete especificado a 
continuation. De esto se desprende, evidentemente, que si esta no es la 
ruta en la que esta instalado nuestro interprete de Python, es necesario 
cambiarla. 

Otra option es utilizar el programa env (de environment, entorno) 
para preguntar al sistema por la ruta al interprete de Python, de forma 
que nuestros usuarios no tengan ningun problema si se diera el caso de 
que el programa no estuviera instalado en dicha ruta: 

#! /usr/bin/env python 
print "Hola Mundo" 
raw_input( ) 

Por supuesto ademas de afiadir el shebang, tendremos que dar permi- 
sos de ejecucion al programa. 
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chmod +x hola.py 



Y listo, si hacemos doble clic el programa se ejecutara, mostrando una 
consola con el texto Hola Mundo, como en el caso de Windows. 

Tambien podriamos correr el programa desde la consola como si trata- 
ra de un ejecutable cualquiera: 

./hola.py 
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En Python los tipos basicos se dividen en: 

• Numeros, como pueden ser 3 (entero) , 15.57 (de coma flotante) o 
7 + 5 j (complejos) 

• Cadenas de texto, como "Hola Mundo" 

• Valores booleanos: True (cierto) y False (falso). 

Vamos a crear un par de variables a modo de ejemplo. Una de tipo 
cadena y una de tipo entero: 

# esto es una cadena 
c = "Hola Mundo" 

# y esto es un entero 
e = 23 

# podemos comprobarlo con la funcion type 
type(c) 

type(e) 

Como veis en Python, a diferencia de muchos otros lenguajes, no se 
declara el tipo de la variable al crearla. En Java, por ejemplo, escribiria- 
mos: 

String c = "Hola Mundo"; 
int e = 23; 



Este pequeno ejemplo tambien nos ha servido para presentar los 
comentarios inline en Python: cadenas de texto que comienzan con el 
caracter # y que Python ignora totalmente. Hay mas tipos de comenta- 
rios, de los que hablaremos mas adelante. 
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Numeros 

Como deciamos, en Python se pueden representar numeros enteros, 
reales y complejos. 

Enteros 

Los numeros enteros son aquellos numeros positivos o negativos que 
no tienen decimales (ademas del cero). En Python se pueden repre- 
sentar mediante el tipo int (de integer, entero) o el tipo long (largo). 
La unica diferencia es que el tipo long permite almacenar numeros 
mas grandes. Es aconsejable no utilizar el tipo long a menos que sea 
necesario, para no malgastar memoria. 

El tipo int de Python se implementa a bajo nivel mediante un tipo 
long de C. Y dado que Python utiliza C por debajo, como C, y a dife- 
rencia de Java, el rango de los valores que puede representar depende 
de la plataforma. 

En la mayor parte de las maquinas el long de C se almacena utilizando 
32 bits, es decir, mediante el uso de una variable de tipo int de Python 
podemos almacenar numeros de -2 31 a 2 31 - 1, o lo que es lo mismo, de 
-2.147.483.648 a 2.147.483.647. En plataformas de 64 bits, el rango es 
de -9.223.372.036.854.775.808 hasta 9.223.372.036.854.775.807. 

El tipo long de Python permite almacenar numeros de cualquier preci- 
sion, estando limitados solo por la memoria disponible en la maquina. 

Al asignar un numero a una variable esta pasara a tener tipo int, a 
menos que el numero sea tan grande como para requerir el uso del tipo 
long. 

# type(entero) devolveria int 
entero = 23 

Tambien podemos indicar a Python que un numero se almacene usan- 
do long anadiendo una L al final: 

# type(entero) devolveria long 
entero = 23L 
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El literal que se asigna a la variable tambien se puede expresar como 
un octal, anteponiendo un cero: 

# 027 octal = 23 en base 10 
entero = 027 

o bien en hexadecimal, anteponiendo un Ox: 

# 0x17 hexadecimal = 23 en base 10 
entero = 0x17 

Reales 

Los numeros reales son los que tienen decimales. En Python se expre- 
san mediante el tipo float. En otros lenguajes de programacion, como 
C, tenemos tambien el tipo double, similar a float pero de mayor 
precision (double = doble precision). Python, sin embargo, implementa 
su tipo float a bajo nivel mediante una variable de tipo double de C, 
es decir, utilizando 64 bits, luego en Python siempre se utiliza doble 
precision, y en concreto se sigue el estandar IEEE 754: 1 bit para el 
signo, 11 para el exponente, y 52 para la mantisa. Esto significa que los 
valores que podemos representar van desde ±2,2250738585072020 x 
lO" 308 hasta ±l,7976931348623157xl0 308 . 

La mayor parte de los lenguajes de programacion siguen el mismo 
esquema para la representation interna. Pero como muchos sabreis 
esta tiene sus limitaciones, impuestas por el hardware. Por eso desde 
Python 2.4 contamos tambien con un nuevo tipo Decimal, para el 
caso de que se necesite representar fracciones de forma mas precisa. 
Sin embargo este tipo esta fuera del alcance de este tutorial, y solo es 
necesario para el ambito de la programacion cienti'fica y otros rela- 
cionados. Para aplicaciones normales podeis utilizar el tipo float sin 
miedo, como ha venido haciendose desde hace anos, aunque teniendo 
en cuenta que los numeros en coma flotante no son precisos (ni en este 
ni en otros lenguajes de programacion). 

Para representar un numero real en Python se escribe primero la parte 
entera, seguido de un punto y por ultimo la parte decimal. 

real = 0.2703 
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Tambien se puede utilizar notation tienti'fica, y anadir una e (de expo- 
nente) para indicar un exponente en base 10. Por ejemplo: 

real = 0. 1e-3 
seria equivalente a 0.1 x 10-3 = 0.1 x 0.001 = 0.0001 

Complejos 

Los numeros complejos son aquellos que tienen parte imaginaria. Si 
no conoci'as de su existencia, es mas que probable que nunca lo vayas a 
necesitar, por lo que puedes saltarte este apartado tranquilamente. De 
hecho la mayor parte de lenguajes de programacion carecen de este 
tipo, aunque sea muy utilizado por ingenieros y cientificos en general. 

En el caso de que necesiteis utilizar numeros complejos, o simplemen- 
te tengais curiosidad, os dire que este tipo, llamado complex en Python, 
tambien se almacena usando coma flotante, debido a que estos nume- 
ros son una extension de los numeros reales. En concreto se almacena 
en una estructura de C, compuesta por dos variables de tipo double, 
sirviendo una de ellas para almacenar la parte real y la otra para la 
parte imaginaria. 

Los numeros complejos en Python se representan de la siguiente 
forma: 

comple jo = 2.1 + 7 . 8 j 

Operadores 

Veamos ahora que podemos hacer con nuestros numeros usando los 
operadores por defecto. Para operaciones mas complejas podemos 
recurrir al modulo math. 



Operadores aritmeticos 



Operador 


Description 


Ejemplo 


+ 


Suma 


r=3+2 #res5 




Resta 


r = 4 - 7 # r es -3 
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Operador 

IT 


Description 


Ejemplo 




Negation 


r = -7 # r es -7 




Multiplication 


r = 2 * 6 # r es 12 


* * 


Exponente 


r = 2 ** 6 # r es 64 


/ 


Division 


r = 3.5 / 2 # r es 1.75 


II 


Division entera 


r = 3.5 // 2 # r es 1.0 


% 


Modulo 


r = 7 % 2 # r es 1 



Puede que tengais dudas sobre como funciona el operador de modulo, 
y cual es la diferencia entre division y division entera. 

El operador de modulo no hace otra cosa que devolvernos el resto de 
la division entre los dos operandos. En el ejemplo, 7/2 seria 3, con 1 de 
resto, luego el modulo es 1. 

La diferencia entre division y division entera no es otra que la que 
indica su nombre. En la division el resultado que se devuelve es un 
numero real, mientras que en la division entera el resultado que se 
devuelve es solo la parte entera. 

No obstante hay que tener en cuenta que si utilizamos dos operandos 
enteros, Python determinara que queremos que la variable resultado 
tambien sea un entero, por lo que el resultado de, por ejemplo, 3 / 2 y 
3 // 2 seria el mismo: 1. 

Si quisieramos obtener los decimales necesitariamos que al menos uno 
de los operandos fuera un numero real, bien indicando los decimales 

r = 3.0 / 2 

o bien utilizando la funcion float (no es necesario que sepais lo que 
significa el termino funcion, ni que recordeis esta forma, lo veremos un 
poco mas adelante): 

r = float(3) / 2 
Esto es asi porque cuando se mezclan tipos de numeros, Python con- 
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vierte todos los operandos al tipo mas complejo de entre los tipos de 
los operandos. 

Operadores a nivel de bit 

Si no conoceis estos operadores es poco probable que vayais a necesi- 
tarlos, por lo que podeis obviar esta parte. Si aun asf teneis curiosidad 
os dire que estos son operadores que actuan sobre las representaciones 
en binario de los operandos. 

Por ejemplo, si veis una operation como 3 & 2, lo que estais viendo es 
un and bit a bit entre los numeros binarios 11 y 10 (las representacio- 
nes en binario de 3 y 2). 

El operador and (&), del ingles "y", devuelve 1 si el primer bit operando 
es 1 y el segundo bit operando es 1. Se devuelve 0 en caso contrario. 

El resultado de aplicar and bit a bit a 11 y 10 seria entonces el numero 
binario 10, o lo que es lo mismo, 2 en decimal (el primer digito es 1 
para ambas cifras, mientras que el segundo es 1 solo para una de ellas). 

El operador or ( I ), del ingles "o", devuelve 1 si el primer operando es 1 
o el segundo operando es 1. Para el resto de casos se devuelve 0. 

El operador xor u or exclusivo ( A ) devuelve 1 si uno de los operandos 
es 1 y el otro no lo es. 

El operador not (~), del ingles "no", sirve para negar uno a uno cada 
bit; es decir, si el operando es 0, cambia a 1 y si es 1, cambia a 0. 



Por ultimo los operadores de desplazamiento (« y ») sirven para 
desplazar los bits n posiciones hacia la izquierda o la derecha. 



Operador 


Description 


Ejemplo 


& 


and 


r=3&2 #res2 


1 


or 


r = 3 1 2 # r es 3 


A 


xor 


r=3»2 f res 1 




not 


r = ~3 # r es -4 
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« 


Desplazamiento izq. 


r = 3 « 1 # r es 6 


>> 


Desplazamiento der. 


r = 3 » 1 # r es 1 



Cadenas 

Las cadenas no son mas que texto encerrado entre comillas simples 
( ' cadena ') o dobles ("cadena"). Dentro de las comillas se pueden 
anadir caracteres especiales escapandolos con \, como \n, el caracter de 
nueva linea, o \t, el de tabulation. 

Una cadena puede estar precedida por el caracter u o el caracter r, los 
cuales indican, respectivamente, que se trata de una cadena que utiliza 
codification Unicode y una cadena raw (del ingles, cruda). Las cade- 
nas raw se distinguen de las normales en que los caracteres escapados 
mediante la barra invertida (\) no se sustituyen por sus contrapartidas. 
Esto es especialmente util, por ejemplo, para las expresiones regulares, 
como veremos en el capi'tulo correspondiente. 

Unicode = u"aoe" 
raw = r"\n" 

Tambien es posible encerrar una cadena entre triples comillas (simples 
o dobles). De esta forma podremos escribir el texto en varias lineas, y 
al imprimir la cadena, se respetaran los saltos de Hnea que introdujimos 
sin tener que recurrir al caracter \n, asi como las comillas sin tener que 
escaparlas. 

triple = """primera linea 

esto se vera en otra linea' 

Las cadenas tambien admiten operadores como +, que funciona reali- 
zando una concatenation de las cadenas utilizadas como operandos y 
*, en la que se repite la cadena tantas veces como lo indique el numero 
utilizado como segundo operando. 

a = "uno" 

b = "dos" 

c=a+b#ces "unodos" 
c=a*3#ces "unounouno" 
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Booleanos 

Como deciamos al comienzo del capitulo una variable de tipo boolea- 
no solo puede tener dos valores: True (cierto) y False (falso). Estos 
valores son especialmente importantes para las expresiones condicio- 
nales y los bucles, como veremos mas adelante. 

En realidad el tipo bool (el tipo de los booleanos) es una subclase del 
tipo int. Puede que esto no tenga mucho sentido para ti si no conoces 
los terminos de la orientacion a objetos, que veremos mas adelante, 
aunque tampoco es nada importante. 

Estos son los distintos tipos de operadores con los que podemos traba- 
jar con valores booleanos, los llamados operadores logicos o condicio- 
nales: 



Operador 


Description 


Ejemplo 


and 


<jse cumple a y b? 


r = True and False # r es 
False 


or 


<;se cumple a o b? 


r = True or False # r es 
True 


not 


No a 


r = not True # r es 
False 



Los valores booleanos son ademas el resultado de expresiones que 
utilizan operadores relacionales (comparaciones entre valores): 



Operador 


Descripcion 


Ejemplo 




<json iguales a y b? 


r = 5 == 3 # r es 
False 


! = 


^son distintos a y b? 


r = 5 != 3 # r es 
True 


< 


^es a menor que b? 


r=5<3 #res 
False 


> 


<;es a mayor que b? 


r=5>3 #res 
True 
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<= 


<;es a menor o igual que b? 


r = 5 <= 5 # r es 
True 


>= 


<;es a mayor o igual que b? 


r = 5 >= 3 # r es 
True 
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En el capitulo anterior vimos algunos tipos basicos, como los numeros, 
las cadenas de texto y los booleanos. En esta leccion veremos algunos 
tipos de colecciones de datos: listas, tuplas y diccionarios. 

Listas 

La lista es un tipo de coleccion ordenada. Seria equivalente a lo que en 
otros lenguajes se conoce por arrays, o vectores. 

Las listas pueden contener cualquier tipo de dato: numeros, cadenas, 
booleanos, . . . y tambien listas. 

Crear una lista es tan sencillo como indicar entre corchetes, y separa- 
dos por comas, los valores que queremos incluir en la lista: 

1 = [22, True, "una lista", [1, 2]] 

Podemos acceder a cada uno de los elementos de la lista escribiendo el 
nombre de la lista e indicando el indice del elemento entre corchetes. 
Ten en cuenta sin embargo que el indice del primer elemento de la 
lista es 0, y no 1: 

1 = [11, False] 

mi_var = l[0] # mi_var vale 11 

Si queremos acceder a un elemento de una lista incluida dentro de otra 
lista tendremos que utilizar dos veces este operador, primero para in- 
dicar a que posicion de la lista exterior queremos acceder, y el segundo 
para seleccionar el elemento de la lista interior: 

1 = ["una lista", [1, 2]] 
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mi_var = 1[1][0] # mi_var vale 1 

Tambien podemos utilizar este operador para modificar un elemento 
de la lista si lo colocamos en la parte izquierda de una asignacion: 

1 = [22, True] 

l[0] = 99 # Con esto 1 valdra [99, True] 

El uso de los corchetes para acceder y modificar los elementos de una 
lista es comun en muchos lenguajes, pero Python nos depara varias 
sorpresas muy agradables. 

Una curiosidad sobre el operador [ ] de Python es que podemos utili- 
zar tambien numeros negativos. Si se utiliza un numero negativo como 
indice, esto se traduce en que el mdice empieza a contar desde el final, 
hacia la izquierda; es decir, con [ - 1 ] accederiamos al ultimo elemento 
de la lista, con [ - 2 ] al penultimo, con [ - 3 ] , al antepenultimo, y asi 
sucesivamente. 

Otra cosa inusual es lo que en Python se conoce como slicing o parti- 
cionado, y que consiste en ampliar este mecanismo para permitir selec- 
cionar porciones de la lista. Si en lugar de un numero escribimos dos 
numeros inicioyfin separados por dos puntos (inicio:fin) Python 
interpretara que queremos una lista que vaya desde la posicion inicio 
a la posicion fin, sin incluir este ultimo. Si escribimos tres numeros 
(inicio:fin:salto)en lugar de dos, el tercero se utiliza para determi- 
nar cada cuantas posiciones anadir un elemento a la lista. 

1 = [99, True, "una lista" , [ 1 , 2] ] 
mi_var = I [ 0 : 2 ] # mi_var vale [99, True] 
mi_var = I [© : 4 : 2 ] # mi_var vale [99, "una lista"] 

Los numeros negativos tambien se pueden utilizar en un slicing, con el 
mismo comportamiento que se comento anteriormente. 

Hay que mencionar asi mismo que no es necesario indicar el principio 
y el final del slicing, sino que, si estos se omiten, se usaran por defecto 
las posiciones de inicio y fin de la lista, respectivamente: 

1 = [99, True, "una lista"] 

mi_var = l[1:j # mi_var vale [True, "una lista"] 
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mi_var = l[:2] # mi_var vale [99, True] 

mi_var = ![:] # mi_var vale [99, True, "una lista"] 

mi_var = l[::2] # mi_var vale [99, "una lista"] 

Tambien podemos utilizar este mecanismo para modificar la lista: 

1 = [99, True, "una lista" , [ 1 , 2] ] 

1[0:2] = [0, 1] # 1 vale [0, 1, "una lista", [1, 2]] 

pudiendo incluso modificar el tamano de la lista si la lista de la parte 
derecha de la asignacion tiene un tamano menor o mayor que el de la 
seleccion de la parte izquierda de la asignacion: 

1[0:2] = [False] # 1 vale [False, "una lista", [1, 2]] 

En todo caso las listas ofrecen mecanismos mas comodos para ser mo- 
dificadas a traves de las funciones de la clase correspondiente, aunque 
no veremos estos mecanismos hasta mas adelante, despues de explicar 
lo que son las clases, los objetos y las funciones. 

Tuplas 

Todo lo que hemos explicado sobre las listas se aplica tambien a las 
tuplas, a exception de la forma de definirla, para lo que se utilizan 
parentesis en lugar de corchetes. 

t = (1 , 2, True, "python") 

En realidad el constructor de la tupla es la coma, no el parentesis, pero 
el interprete muestra los parentesis, y nosotros deberiamos utilizarlos, 
por claridad. 

»> t = 1 , 2, 3 
»> type(t) 
type "tuple" 

Ademas hay que tener en cuenta que es necesario anadir una coma 
para tuplas de un solo elemento, para diferenciarlo de un elemento 
entre parentesis. 

»> t = (1) 
>» type(t) 
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type "int" 
»> t = (1,) 
>» type(t) 
type "tuple" 

Para referirnos a elementos de una tupla, como en una lista, se usa el 
operador [ ] : 

mi_var = t[0] # mi_var es 1 
mi_var = t[0:2] # mi_var es (1, 2) 

Podemos utilizar el operador [ ] debido a que las tuplas, al igual que 
las listas, forman parte de un tipo de objetos llamados secuencias. 
Permitirme un pequeno inciso para indicaros que las cadenas de texto 
tambien son secuencias, por lo que no os extrafiara que podamos hacer 
cosas como estas: 

c = "hola mundo" 
c[0] # h 
c[5 : ] # mundo 
c[ : :3] # hauo 

Volviendo al tenia de las tuplas, su diferencia con las listas estriba en 
que las tuplas no poseen estos mecanismos de modification a traves 
de funciones tan utiles de los que hablabamos al final de la anterior 
section. 

Ademas son inmutables, es decir, sus valores no se pueden modificar 
una vez creada; y tienen un tamano fijo. 

A cambio de estas limitaciones las tuplas son mas "ligeras" que las 
listas, por lo que si el uso que le vamos a dar a una coleccion es muy 
basico, puedes utilizar tuplas en lugar de listas y ahorrar memoria. 

Diccionarios 

Los diccionarios, tambien llamados matrices asociativas, deben su 
nombre a que son colecciones que relacionan una clave y un valor. Por 
ejemplo, veamos un diccionario de peli'culas y directores: 

d = {"Love Actually ": "Richard Curtis", 
"Kill Bill": "Tarantino", 
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"Amelie": "Jean-Pierre Jeunet"} 

El primer valor se trata de la clave y el segundo del valor asociado 
a la clave. Como clave podemos utilizar cualquier valor inmutable: 
podriamos usar numeros, cadenas, booleanos, tuplas, . . . pero no listas 
o diccionarios, dado que son mutables. Esto es asi porque los diccio- 
narios se implementan como tablas hash, y a la hora de introducir un 
nuevo par clave-valor en el diccionario se calcula el hash de la clave 
para despues poder encontrar la entrada correspondiente rapidamente. 
Si se modificara el objeto clave despues de haber sido introducido en el 
diccionario, evidentemente, su hash tambien cambiaria y no podria ser 
encontrado. 

La diferencia principal entre los diccionarios y las listas o las tuplas es 
que a los valores almacenados en un diccionario se les accede no por su 
fndice, porque de hecho no tienen orden, sino por su clave, utilizando 
de nuevo el operador [ ] . 

d["Love Actually "] # devuelve "Richard Curtis" 

Al igual que en listas y tuplas tambien se puede utilizar este operador 
para reasignar valores. 

d[ "Kill Bill"] = "Quentin Tarantino" 

Sin embargo en este caso no se puede utilizar slicing, entre otras cosas 
porque los diccionarios no son secuencias, si no mappings (mapeados, 
asociaciones). 



28 



CONTROL DE FLUJO 



En esta lection vamos a ver los condicionales y los bucles. 



Sentencias condicionales 

Si un programa no fuera mas que una lista de ordenes a ejecutar de 
forma secuencial, una por una, no tendria mucha utilidad. Los con- 
dicionales nos permiten comprobar condiciones y hacer que nuestro 
programa se comporte de una forma u otra, que ejecute un fragmento 
de codigo u otro, dependiendo de esta condicion. 

Aqui es donde cobran su importancia el tipo booleano y los operadores 
logicos y relacionales que aprendimos en el capi'tulo sobre los tipos 
basicos de Python. 

if 

La forma mas simple de un estamento condicional es un if (del ingles 
si) seguido de la condicion a evaluar, dos puntos ( : ) y en la siguiente 
lfnea e indentado, el codigo a ejecutar en caso de que se cumpla dicha 
condicion. 



fav = "mundogeek.net" 

# si (if) fav es igual a "mundogeek.net" 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 

print "Gracias" 



Como veis es bastante sencillo. 



Eso si, aseguraros de que indentais el codigo tal cual se ha hecho en el 
ejemplo, es decir, aseguraros de pulsar Tabulation antes de las dos or- 
denes print, dado que esta es la forma de Python de saber que vuestra 
intention es la de que los dos print se ejecuten solo en el caso de que 
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se cumpla la condicion, y no la de que se imprima la primera cadena si 
se cumple la condicion y la otra siempre, cosa que se expresaria asi: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 

En otros lenguajes de programacion los bloques de codigo se determi- 
nan encerrandolos entre Haves, y el indentarlos no se trata mas que de 
una buena practica para que sea mas sencillo seguir el flujo del progra- 
ma con un solo golpe de vista. Por ejemplo, el codigo anterior expresa- 
do en Java seria algo asi: 

String fav = "mundogeek.net"; 

if (fav. equal s( "mundogeek . net " ) ) { 

System. out .print ln("Tienes buen gusto!"); 

System. out . print In ( "Gracias" ) ; 

} 

Sin embargo, como ya hemos comentado, en Python se trata de una 
obligation, y no de una election. De esta forma se obliga a los progra- 
madores a indentar su codigo para que sea mas sencillo de leer :) 

if ... else 

Vamos a ver ahora un condicional algo mas complicado. <;Que haria- 
mos si quisieramos que se ejecutaran unas ciertas ordenes en el caso de 
que la condicion no se cumpliera? Sin duda podriamos anadir otro if 
que tuviera como condicion la negation del primero: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 

if fav != "mundogeek.net": 
print "Vaya, que lastima" 

pero el condicional tiene una segunda construction mucho mas util: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 

print "Gracias" 
else: 

print "Vaya, que lastima" 
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Vemos que la segunda condition se puede sustituir con un else (del 
ingles: si no, en caso contrario). Si leemos el codigo vemos que tiene 
bastante sentido: "si fav es igual a mundogeek.net, imprime esto y esto, 
si no, imprime esto otro". 

if ... elif ... elif ... else 

Todavi'a queda una construccion mas que ver, que es la que hace uso 
del elif. 



if numero < 0: 

print "Negativo" 
elif numero > 0: 

print "Positivo" 
else: 

print "Cero" 



elif es una contraction de else if,poi lo tanto elif numero > 0 puede 
leerse como "si no, si numero es mayor que 0". Es decir, primero se 
evalua la condition del if. Si es cierta, se ejecuta su codigo y se con- 
tinua ejecutando el codigo posterior al condicional; si no se cumple, 
se evalua la condition del elif. Si se cumple la condition del elif 
se ejecuta su codigo y se continua ejecutando el codigo posterior al 
condicional; si no se cumple y hay mas de un el if se continua con el 
siguiente en orden de aparicion. Si no se cumple la condition del i f ni 
de ninguno de los elif, se ejecuta el codigo del else. 



A if C else B 



Tambien existe una construccion similar al operador ? de otros lengua- 
jes, que no es mas que una forma compacta de expresar un if else. En 
esta construccion se evalua el predicado C y se devuelve A si se cumple 
o B si no se cumple: A if C else B. Veamos un ejemplo: 

var = "par" if (num % 2 == 0) else "impar" 

Y eso es todo. Si conoceis otros lenguajes de programacion puede que 
esperarais que os hablara ahora del switch, pero en Python no existe 
esta construccion, que podria emularse con un simple diccionario, asi 
que pasemos directamente a los bucks. 
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Bucles 

Mientras que los condicionales nos permiten ejecutar distintos frag- 
mentos de codigo dependiendo de ciertas condiciones, los bucles nos 
permiten ejecutar un mismo fragmento de codigo un cierto numero de 
veces, mientras se cumpla una determinada condicion. 

while 

El bucle while (mientras) ejecuta un fragmento de codigo mientras se 
cumpla una condicion. 

edad = 0 
while edad < 18: 
edad = edad + 1 

print "Felicidades , tienes " + str(edad) 

La variable edad comienza valiendo 0. Como la condicion de que edad 
es menor que 18 es cierta (0 es menor que 18), se entra en el bucle. 
Se aumenta edad en 1 y se imprime el mensaje informando de que 
el usuario ha cumplido un ano. Recordad que el operador + para las 
cadenas funciona concatenando ambas cadenas. Es necesario utilizar 
la funcion str (de string, cadena) para crear una cadena a partir del 
numero, dado que no podemos concatenar numeros y cadenas, pero ya 
comentaremos esto y mucho mas en proximos capitulos. 

Ahora se vuelve a evaluar la condicion, y 1 sigue siendo menor que 18, 
por lo que se vuelve a ejecutar el codigo que aumenta la edad en un 
ano e imprime la edad en la pantalla. El bucle continuara ejecutandose 
hasta que edad sea igual a 18, momento en el cual la condicion dejara 
de cumplirse y el programa continuaria ejecutando las instrucciones 
siguientes al bucle. 

Ahora imaginemos que se nos olvidara escribir la instruction que 
aumenta la edad. En ese caso nunca se llegaria a la condicion de que 
edad fuese igual o mayor que 18, siempre seria 0, y el bucle continuaria 
indefinidamente escribiendo en pantalla Has cumplido 0. 

Esto es lo que se conoce como un bucle infinito. 
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Sin embargo hay situaciones en las que un bucle infinite es util. Por 
ejemplo, veamos un pequeno programa que repite todo lo que el usua- 
rio diga hasta que escriba adios. 

while True: 

entrada = raw_input("> ") 
if entrada == "adios" : 

break 
else : 

print entrada 

Para obtener lo que el usuario escriba en pantalla utilizamos la funcion 
raw_input. No es necesario que sepais que es una funcion ni como 
funciona exactamente, simplemente aceptad por ahora que en cada 
iteracion del bucle la variable entrada contendra lo que el usuario 
escribio hasta pulsar Enter. 

Comprobamos entonces si lo que escribio el usuario fue adios, en cuyo 
caso se ejecuta la orden break o si era cualquier otra cosa, en cuyo caso 
se imprime en pantalla lo que el usuario escribio. 

La palabra clave break (romper) sale del bucle en el que estamos. 

Este bucle se podria haber escrito tambien, no obstante, de la siguiente 
forma: 

salir = False 
while not salir: 

entrada = raw_input() 
if entrada == "adios" : 

salir = True 
else : 

print entrada 

pero nos ha servido para ver como funciona break. 

Otra palabra clave que nos podemos encontrar dentro de los bucles es 
continue (continuar). Como habreis adivinado no hace otra cosa que 
pasar directamente a la siguiente iteracion del bucle. 

edad = 0 

while edad < 18: 
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edad = edad + 1 
if edad % 2 == 0: 
continue 

print "Felicidades , tienes " + str(edad) 

Como veis esta es una pequena modification de nuestro programa de 
felicitaciones. En esta ocasion hemos anadido un if que comprueba si 
la edad es par, en cuyo caso saltamos a la proxima iteration en lugar de 
imprimir el mensaje. Es decir, con esta modification el programa solo 
imprimiria felicitaciones cuando la edad fuera impar. 

for ... in 

A los que hayais tenido experiencia previa con segun que lenguajes este 
bucle os va a sorprender gratamente. En Python for se utiliza como 
una forma generica de iterar sobre una secuencia. Y como tal intenta 
facilitar su uso para este fin. 

Este es el aspecto de un bucle for en Python: 

secuencia = ["uno", "dos", "tres"] 
for elemento in secuencia: 
print elemento 

Como hemos dicho los for se utilizan en Python para recorrer secuen- 
cias, por lo que vamos a utilizar un tipo secuencia, como es la lista, para 
nuestro ejemplo. 

Leamos la cabecera del bucle como si de lenguaje natural se tratara: 
"para cada elemento en secuencia". Y esto es exactamente lo que hace 
el bucle: para cada elemento que tengamos en la secuencia, ejecuta 
estas lineas de codigo. 

Lo que hace la cabecera del bucle es obtener el siguiente elemento de 
la secuencia secuencia y almacenarlo en una variable de nombre ele- 
mento. Por esta razon en la primera iteration del bucle elemento valdra 
"uno", en la segunda "dos",yenla tercera "tres". 

Facil y sencillo. 

En C o C++, por ejemplo, lo que habriamos hecho seria iterar sobre las 
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posiciones, y no sobre los elementos: 

int mi_array[] = {1, 2, 3, 4, 5}; 
int i ; 

for(i =0; i < 5; i++) { 

printf ( "%d\n" , mi_array[ i ] ) ; 

1 



Es decir, tendriamos un buck for que fuera aumentando una variable 
i en cada iteration, desde 0 al tamano de la secuencia, y utilizariamos 
esta variable a modo de indice para obtener cada elemento e imprimir- 
lo. 

Como veis el enfoque de Python es mas natural e intuitive 

Pero, <jque ocurre si quisieramos utilizar el for como si estuvieramos en 
C o en Java, por ejemplo, para imprimir los numeros de 30 a 50? No os 
preocupeis, porque no necesitariais crear una lista y anadir uno a uno 
los numeros del 30 al 50. Python proporciona una funcion llamada 
range (rango) que permite generar una lista que vaya desde el primer 
numero que le indiquemos al segundo. Lo veremos despues de ver al 
fin a que se refiere ese termino tan recurrente: las funciones. 
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Una funcion es un fragmento de codigo con un nombre asociado que 
realiza una serie de tareas y devuelve un valor. A los fragmentos de 
codigo que tienen un nombre asociado y no devuelven valores se les 
suele llamar procedimientos. En Python no existen los procedimien- 
tos, ya que cuando el programador no especifica un valor de retorno la 
funcion devuelve el valor None (nada), equivalente al null de Java. 

Ademas de ayudarnos a programar y depurar dividiendo el programa 
en partes las funciones tambien permiten reutilizar codigo. 

En Python las funciones se declaran de la siguiente forma: 

def mi_f uncion(paraml , param2): 
print paraml 
print param2 

Es decir, la palabra clave def seguida del nombre de la funcion y entre 
parentesis los argumentos separados por comas. A continuation, en 
otra linea, indentado y despues de los dos puntos tendriamos las lineas 
de codigo que conforman el codigo a ejecutar por la funcion. 

Tambien podemos encontrarnos con una cadena de texto como 
primera linea del cuerpo de la funcion. Estas cadenas se conocen con 
el nombre de docstring (cadena de documentation) y sirven, como su 
nombre indica, a modo de documentation de la funcion. 

def mi_f uncion(paraml , param2): 

"""Esta funcion imprime los dos valores pasados 
como parametros""" 
print paraml 
print param2 

Esto es lo que imprime el opeardor ? de iPython o la funcion help 
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del lenguaje para proporcionar una ayuda sob re el uso y utilidad de 
las funciones. Todos los objetos pueden tener docstrings, no solo las 
funciones, como veremos mas adelante. 

Volviendo a la declaration de funciones, es importante aclarar que 
al declarar la funcion lo unico que hacemos es asociar un nombre al 
fragmento de codigo que conforma la funcion, de forma que podamos 
ejecutar dicho codigo mas tarde referenciandolo por su nombre. Es 
decir, a la hora de escribir estas Hneas no se ejecuta la funcion. Para 
llamar a la funcion (ejecutar su codigo) se escribiria: 

mi_f uncion( "hola" , 2) 

Es decir, el nombre de la funcion a la que queremos llamar seguido de 
los valores que queramos pasar como parametros entre parentesis. La 
asociacion de los parametros y los valores pasados a la funcion se hace 
normalmente de izquierda a derecha: como a paraml le hemos dado un 
valor "hola" y param2 vale 2, mi_f uncion imprimiria hola en una linea, 
y a continuation 2. 

Sin embargo tambien es posible modificar el orden de los parametros 
si indicamos el nombre del parametro al que asociar el valor a la hora 
de llamar a la funcion: 

mi_f uncion(param2 = 2, paraml = "hola") 

El numero de valores que se pasan como parametro al llamar a la fun- 
cion tiene que coincidir con el numero de parametros que la funcion 
acepta segun la declaration de la funcion. En caso contrario Python se 
quejara: 

»> mi_f uncion( "hola" ) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: mi_funcion() takes exactly 2 arguments (1 given) 

Tambien es posible, no obstante, deflnir funciones con un numero va- 
riable de argumentos, o bien asignar valores por defecto a los parame- 
tros para el caso de que no se indique ningun valor para ese parametro 
al llamar a la funcion. 
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Los valores por defecto para los parametros se definen situando un 
signo igual despues del nombre del parametro y a continuation el valor 
por defecto: 

def imprimir(texto, veces = 1): 
print veces * texto 

En el ejemplo anterior si no indicamos un valor para el segundo 
parametro se imprimira una sola vez la cadena que le pasamos como 
primer parametro: 

»> imprimir( "hola" ) 
hola 

si se le indica otro valor, sera este el que se utilice: 

»> imprimir( "hola" , 2) 
holahola 

Para definir funciones con un numero variable de argumentos coloca- 
mos un ultimo parametro para la funcion cuyo nombre debe preceder- 
se de un signo *: 

def varios(param1 , param2, *otros): 
for val in otros: 
print val 

varios(l, 2) 
varios(1, 2, 3) 
varios(l, 2, 3, 4) 

Esta sintaxis funciona creando una tupla (de nombre otros en el 
ejemplo) en la que se almacenan los valores de todos los parametros 
extra pasados como argumento. Para la primera llamada, varios( 1 , 2), 
la tupla otros estaria vacia dado que no se han pasado mas parametros 
que los dos defmidos por defecto, por lo tanto no se imprimiria nada. 
En la segunda llamada otros valdria ( 3 , ) , y en la tercera ( 3 , 4 ) . 

Tambien se puede preceder el nombre del ultimo parametro con **, en 
cuyo caso en lugar de una tupla se utilizaria un diccionario. Las claves 
de este diccionario serian los nombres de los parametros indicados al 
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llamar a la funcion y los valores del diccionario, los valores asociados a 
estos parametros. 

En el siguiente ejemplo se utiliza la funcion items de los diccionarios, 
que devuelve una lista con sus elementos, para imprimir los parametros 
que contiene el diccionario. 

def varios(param1 , param2, **otros): 
for i in otros . items( ) : 
print i 

varios(1, 2, tercero = 3) 

Los que conozcais algun otro lenguaje de programacion os estareis 
preguntando si en Python al pasar una variable como argumento de 
una funcion estas se pasan por referencia o por valor. En el paso por 
referencia lo que se pasa como argumento es una referencia o puntero 
a la variable, es decir, la direction de memoria en la que se encuentra el 
contenido de la variable, y no el contenido en si. En el paso por valor, 
por el contrario, lo que se pasa como argumento es el valor que conte- 
nia la variable. 

La diferencia entre ambos estriba en que en el paso por valor los 
cambios que se hagan sobre el parametro no se ven fuera de la fun- 
cion, dado que los argumentos de la funcion son variables locales a la 
funcion que contienen los valores indicados por las variables que se 
pasaron como argumento. Es decir, en realidad lo que se le pasa a la 
funcion son copias de los valores y no las variables en si. 

Si quisieramos modificar el valor de uno de los argumentos y que estos 
cambios se reflejaran fuera de la funcion tendriamos que pasar el para- 
metro por referencia. 

En C los argumentos de las funciones se pasan por valor, aunque se 
puede simular el paso por referencia usando punteros. En Java tambien 
se usa paso por valor, aunque para las variables que son objetos lo que 
se hace es pasar por valor la referencia al objeto, por lo que en realidad 
parece paso por referencia. 

En Python tambien se utiliza el paso por valor de referencias a objetos, 
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como en Java, aunque en el caso de Python, a diferencia de Java, todo 
es un objeto (para ser exactos lo que ocurre en realidad es que al objeto 
se le asigna otra etiqueta o nombre en el espacio de nombres local de la 
funcion). 

Sin embargo no todos los cambios que hagamos a los parametros 
dentro de una funcion Python se reflejaran fuera de esta, ya que hay 
que tener en cuenta que en Python existen objetos inmutables, como 
las tuplas, por lo que si intentaramos modificar una tupla pasada como 
parametro lo que ocurriria en realidad es que se crearia una nueva ins- 
tancia, por lo que los cambios no se verian fuera de la funcion. 

Veamos un pequeno programa para demostrarlo. En este ejemplo 
se hace uso del metodo append de las listas. Un metodo no es mas 
que una funcion que pertenece a un objeto, en este caso a una lista; y 
append, en concreto, sirve para anadir un elemento a una lista. 

def f(x, y): 
x = x + 3 
y . append(23) 
print x, y 

x = 22 
y = [22] 
f(x, y) 
print x, y 

El resultado de la ejecucion de este programa seria 

25 [22, 23] 
22 [22, 23] 

Como vemos la variable x no conserva los cambios una vez salimos de 
la funcion porque los enteros son inmutables en Python. Sin embargo 
la variable y si los conserva, porque las listas son mutables. 

En resumen: los valores mutables se comportan como paso por refe- 
renda, y los inmutables como paso por valor. 

Con esto terminamos todo lo relacionado con los parametros de las 
funciones. Veamos por ultimo como devolver valores, para lo que se 
utiliza la palabra clave return: 
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def sumar(x , y) : 
return x + y 

print sumar(3, 2) 

Como vemos esta funcion tan sencilla no hace otra cosa que sumar los 
valores pasados como parametro y devolver el resultado como valor de 
retorno. 

Tambien podriamos pasar varios valores que retornar a return. 

def f(x, y): 

return x * 2, y * 2 

a, b = f(1, 2) 

Sin embargo esto no quiere decir que las funciones Python puedan de- 
volver varios valores, lo que ocurre en realidad es que Python crea una 
tupla al vuelo cuyos elementos son los valores a retornar, y esta unica 
variable es la que se devuelve. 
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En el capi'tulo de introduction ya comentabamos que Python es un 
lenguaje multiparadigma en el se podia trabajar con programacion es- 
tructurada, como veniamos haciendo hasta ahora, o con programacion 
orientada a objetos o programacion funcional. 

La Programacion Orientada a Objetos (POO u OOP segun sus siglas 
en ingles) es un paradigma de programacion en el que los conceptos 
del mundo real relevantes para nuestro problema se modelan a traves 
de clases y objetos, y en el que nuestro programa consiste en una serie 
de interacciones entre estos objetos. 

Clases y objetos 

Para entender este paradigma primero tenemos que comprender que es 
una clase y que es un objeto. Un objeto es una entidad que agrupa un 
estado y una funcionalidad relacionadas. El estado del objeto se define 
a traves de variables llamadas atributos, mientras que la funcionalidad 
se modela a traves de funciones a las que se les conoce con el nombre 
de metodos del objeto. 

Un ejemplo de objeto podria ser un coche, en el que tendriamos atri- 
butos como la marca, el numero de puertas o el tipo de carburante y 
metodos como arrancar y parar. O bien cualquier otra combination de 
atributos y metodos segun lo que fuera relevante para nuestro progra- 
ma. 

Una clase, por otro lado, no es mas que una plantilla generica a partir 
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de la cual instanciar los objetos; plantilla que es la que define que atri- 
butos y metodos tendran los objetos de esa clase. 

Volviendo a nuestro ejemplo: en el mundo real existe un conjunto de 
objetos a los que llamamos coches y que tienen un conjunto de atribu- 
tos comunes y un comportamiento comun, esto es a lo que llamamos 
clase. Sin embargo, mi coche no es igual que el coche de mi vecino, y 
aunque pertenecen a la misma clase de objetos, son objetos distintos. 

En Python las clases se definen mediante la palabra clave class segui- 
da del nombre de la clase, dos puntos ( : ) y a continuation, indentado, 
el cuerpo de la clase. Como en el caso de las funciones, si la primera 
linea del cuerpo se trata de una cadena de texto, esta sera la cadena de 
documentation de la clase o docstring. 

class Coche: 

" " "Abstraccion de los objetos coche.""" 

def init (self, gasolina): 

self .gasolina = gasolina 

print "Tenemos", gasolina, "litros" 

def arrancar(self ) : 

if self .gasolina > 0: 

print "Arranca" 
else: 

print "No arranca" 

def conducir(self ) : 

if self .gasolina > 0: 
self .gasolina -= 1 

print "Quedan", self .gasolina, "litros" 
else: 

print "No se mueve" 



Lo primero que llama la atencion en el ejemplo anterior es el nombre 
tan curioso que tiene el metodo init . Este nombre es una conven- 
tion y no un capricho. El metodo init , con una doble barra baja al 

principio y final del nombre, se ejecuta justo despues de crear un nuevo 
objeto a partir de la clase, proceso que se conoce con el nombre de 

instantiation. El metodo init sirve, como sugiere su nombre, para 

realizar cualquier proceso de initialization que sea necesario. 



Como vemos el primer parametro de init y del resto de metodos 
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de la clase es siempre self. Esta es una idea inspirada en Modula-3 y 
sirve para referirse al objeto actual. Este mecanismo es necesario para 
poder acceder a los atributos y metodos del objeto diferenciando, por 
ejemplo, una variable local mi_var de un atributo del objeto self . 
mi_var. 

Si volvemos al metodo init de nuestra clase Coche veremos como 

se utiliza self para asignar al atributo gasolina del objeto (self . gaso- 
1 ina) el valor que el programador especifico para el parametro gasol i - 
na. El parametro gasolina se destruye al final de la funcion, mientras 
que el atributo gasolina se conserva (y puede ser accedido) mientras el 
objeto viva. 

Para crear un objeto se escribirfa el nombre de la clase seguido de cual- 
quier parametro que sea necesario entre parentesis. Estos parametros 

son los que se pasaran al metodo init , que como deciamos es el 

metodo que se llama al instanciar la clase. 

mi_coche = Coche(3) 

Os preguntareis entonces como es posible que a la hora de crear nues- 

tro primer objeto pasemos un solo parametro a init , el numero 

3, cuando la definition de la funcion indica claramente que precisa de 
dos parametros (self y gasolina). Esto es asi porque Python pasa el 
primer argumento (la referencia al objeto que se crea) automagicamen- 
te. 

Ahora que ya hemos creado nuestro objeto, podemos acceder a sus 
atributos y metodos mediante la sintaxis objeto .atributo y objeto. 
metodo( ): 

»> print mi_coche. gasolina 
3 

»> mi_coche . arrancar( ) 
Arranca 

»> mi_coche . conducir( ) 

Quedan 2 litros 

»> mi_coche . conducir( ) 

Quedan 1 litros 

»> mi_coche . conducir( ) 

Quedan 0 litros 

»> mi_coche . conducir( ) 
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No se mueve 

»> mi_coche . arrancar( ) 
No arranca 

»> print mi_coche.gasolina 
0 



Como ultimo apunte recordar que en Python, como ya se comento 
en repetidas ocasiones anteriormente, todo son objetos. Las cadenas, 
por ejemplo, tienen metodos como upper ( ), que devuelve el texto en 
mayusculas o count(sub), que devuelve el numero de veces que se 
encontro la cadena sub en el texto. 



Herencia 

Hay tres conceptos que son basicos para cualquier lenguaje de pro- 
gramacion orientado a objetos: el encapsulamiento, la herencia y el 
polimorfismo. 

En un lenguaje orientado a objetos cuando hacemos que una clase 
(subclase) herede de otra clase (superclase) estamos haciendo que la 
subclase contenga todos los atributos y metodos que tenia la supercla- 
se. No obstante al acto de heredar de una clase tambien se le llama a 
menudo "extender una clase". 

Supongamos que queremos modelar los instrumentos musicales de 
una banda, tendremos entonces una clase Guitarra, una clase Bateria, 
una clase Ba jo, etc. Cada una de estas clases tendra una serie de atribu- 
tos y metodos, pero ocurre que, por el mero hecho de ser instrumentos 
musicales, estas clases compartiran muchos de sus atributos y metodos; 
un ejemplo seria el metodo tocar( ). 

Es mas sencillo crear un tipo de objeto Instrumento con las atributos y 
metodos comunes e indicar al programa que Guitarra, Bateria y Ba jo 
son tipos de instrumentos, haciendo que hereden de Instrumento. 

Para indicar que una clase hereda de otra se coloca el nombre de la cla- 
se de la que se hereda entre parentesis despues del nombre de la clase: 

class Instrumento: 

def init (self, precio): 
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self . precio = precio 

def tocar(self): 

print "Estamos tocando musica" 

def romper(self ) : 

print "Eso lo pagas tu" 

print "Son", self. precio, "$$$" 

class Bateria( Instrumento) : 
pass 

class Guitarra( Instrumento) : 
pass 

Como Bateria y Guitarra heredan de Instrumento, ambos tienen un 
metodo tocar() yun metodo romper(),yse inicializan pasando un 
parametro precio. Pero, <jque ocurriria si quisieramos especificar un 
nuevo parametro tipo_cuerda a la hora de crear un objeto Guitarra? 

Bastarfa con escribir un nuevo metodo init para la clase Guitarra 

que se ejecutaria en lugar del init de Instrumento. Esto es lo que 

se conoce como sobreescribir metodos. 

Ahora bien, puede ocurrir en algunos casos que necesitemos sobrees- 
cribir un metodo de la clase padre, pero que en ese metodo queramos 
ejecutar el metodo de la clase padre porque nuestro nuevo metodo no 
necesite mas que ejecutar un par de nuevas instrucciones extra. En ese 
caso usariamos la sintaxis SuperClase .metodo(self , args) parallamar 
al metodo de igual nombre de la clase padre. Por ejemplo, para llamar 

al metodo init de Instrumento desde Guitarra usariamos Instru- 
mento. init (self, precio) 

Observad que en este caso si es necesario especificar el parametro self. 

Herencia multiple 

En Python, a diferencia de otros lenguajes como Java o C#, se permite 
la herencia multiple, es decir, una clase puede heredar de varias clases a 
la vez. Por ejemplo, podriamos tener una clase Cocodrilo que heredara 
de la clase Terrestre, con metodos como caminar( ) y atributos como 
velocidad_caminar y de la clase Acuatico, con metodos como nadar( ) 
y atributos como velocidad_nadar. Basta con enumerar las clases de 
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las que se hereda separandolas por comas: 

class Cocodrilo(Terrestre, Acuatico): 
pass 

En el caso de que alguna de las clases padre tuvieran metodos con el 
mismo nombre y numero de parametros las clases sobreescribirian la 
implementation de los metodos de las clases mas a su derecha en la 
definition. 

En el siguiente ejemplo, como Terrestre se encuentra mas a la iz- 
quierda, seria la definition de desplazar de esta clase la que prevale- 
ceria, y por lo tanto si llamamos al metodo desplazar de un objeto de 
tipo Cocodrilo lo que se imprimiria seria "El animal anda". 

class Terrestre: 

def desplazar(self ) : 

print "El animal anda" 

class Acuatico: 

def desplazar(self ) : 

print "El animal nada" 

class Cocodrilo(Terrestre, Acuatico): 
pass 

c = Cocodrilo( ) 
c . desplazar( ) 

Polimorfismo 

La palabra polimorfismo, del griego poly morphos (varias formas), se re- 
fiere a la habilidad de objetos de distintas clases de responder al mismo 
mensaje. Esto se puede conseguir a traves de la herencia: un objeto de 
una clase derivada es al mismo tiempo un objeto de la clase padre, de 
forma que alii donde se requiere un objeto de la clase padre tambien se 
puede utilizar uno de la clase hija. 

Python, al ser de tipado dinamico, no impone restricciones a los tipos 
que se le pueden pasar a una funcion, por ejemplo, mas alia de que el 
objeto se comporte como se espera: si se va a llamar a un metodo f ( ) 
del objeto pasado como parametro, por ejemplo, evidentemente el 
objeto tendra que contar con ese metodo. Por ese motivo, a diferencia 
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de lenguajes de tipado estatico como Java o C++, el polimorfismo en 
Python no es de gran importancia. 

En ocasiones tambien se utiliza el termino polimorfismo para referirse 
a la sobrecarga de metodos, termino que se define como la capacidad 
del lenguaje de determinar que metodo ejecutar de entre varios meto- 
dos con igual nombre segun el tipo o numero de los parametros que se 
le pasa. En Python no existe sobrecarga de metodos (el ultimo metodo 
sobreescribiria la implementation de los anteriores), aunque se puede 
conseguir un comportamiento similar recurriendo a funciones con va- 
lores por defecto para los parametros o a la sintaxis *params o **params 
explicada en el capi'tulo sobre las funciones en Python, o bien usando 
decoradores (mecanismo que veremos mas adelante). 

Encapsulation 

La encapsulation se refiere a impedir el acceso a determinados me- 
todos y atributos de los objetos estableciendo asi que puede utilizarse 
desde fuera de la clase. 

Esto se consigue en otros lenguajes de programacion como Java utili- 
zando modificadores de acceso que definen si cualquiera puede acceder 
a esa funcion o variable (public) o si esta restringido el acceso a la 
propia clase (private). 

En Python no existen los modificadores de acceso, y lo que se suele 
hacer es que el acceso a una variable o funcion viene determinado por 
su nombre: si el nombre comienza con dos guiones bajos (y no termina 
tambien con dos guiones bajos) se trata de una variable o funcion pri- 
vada, en caso contrario es publica. Los metodos cuyo nombre comien- 
za y termina con dos guiones bajos son metodos especiales que Python 
llama automaticamente bajo ciertas circunstancias, como veremos al 
final del capi'tulo. 

En el siguiente ejemplo solo se imprimira la cadena correspondiente al 
metodo publico( ), mientras que al intentar llamar al metodo pri- 
vacies ) Python lanzara una exception quejandose de que no existe 
(evidentemente existe, pero no lo podemos ver porque es privado). 
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class Ejemplo: 

def publico(self ) : 
print "Publico" 

def privado(self ) : 

print "Privado" 

ej = Ejemplo() 
ej .publico( ) 
e j . privado( ) 



Este mecanismo se basa en que los nombres que comienzan con un 
doble guion bajo se renombran para incluir el nombre de la clase 
(caracteristica que se conoce con el nombre de name mangling). Esto 
implica que el metodo o atributo no es realmente privado, y podemos 
acceder a el mediante una pequena trampa: 

ej ._Ejemplo privado( ) 



En ocasiones tambien puede suceder que queramos permitir el acceso 
a algun atributo de nuestro objeto, pero que este se produzca de forma 
controlada. Para esto podemos escribir metodos cuyo unico cometido 
sea este, metodos que normalmente, por convention, tienen nombres 
como getVariable y setVariable; de ahi que se conozcan tambien con 
el nombre de getters y setters. 

class Fecha(): 

def init (self) : 

self. dia = 1 

def getDia(self ) : 

return self. dia 

def setDia(self, dia): 

if dia > 0 and dia < 31 : 

self. dia = dia 

else: 

print "Error" 

mi_f echa = Fecha( ) 
mi_f echa . setDia(33) 



Esto se podria simplificar mediante propiedades, que abstraen al usua- 
rio del hecho de que se esta utilizando metodos entre bambalinas para 
obtener y modificar los valores del atributo: 
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class Fecha(object) : 

def init (self) : 

self. dia = 1 

def getDia(self ) : 

return self. dia 

def setDia(self, dia): 

if dia > 0 and dia < 31 : 

self. dia = dia 

else: 

print "Error" 

dia = property(getDia , setDia) 

mi_fecha = Fecha() 
mi_fecha.dia = 33 



Clases de "nuevo-estilo" 

En el ejemplo anterior os habra llamado la atencion el hecho de que la 
clase Fecha derive de object. La razon de esto es que para poder usar 
propiedades la clase tiene que ser de "nuevo-estilo", clases enriquecidas 
introducidas en Python 2.2 que seran el estandar en Python 3.0 pero 
que aun conviven con las clases "clasicas" por razones de retrocompa- 
tibilidad. Ademas de las propiedades las clases de nuevo estilo anaden 
otras funcionalidades como descriptores o metodos estaticos. 

Para que una clase sea de nuevo estilo es necesario, por ahora, que 
extienda una clase de nuevo-estilo. En el caso de que no sea necesa- 
rio heredar el comportamiento o el estado de ninguna clase, como en 
nuestro ejemplo anterior, se puede heredar de object, que es un objeto 
vacio que sirve como base para todas las clases de nuevo estilo. 

La diferencia principal entre las clases antiguas y las de nuevo estilo 
consiste en que a la hora de crear una nueva clase anteriormente no se 
defim'a realmente un nuevo tipo, sino que todos los objetos creados a 
partir de clases, fueran estas las clases que fueran, eran de tipo instan- 
ce. 



Metodos especiales 
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Ya vimos al principio del articulo el uso del metodo init Exis- 

ten otros metodos con significados especiales, cuyos nombres siempre 
comienzan y terminan con dos guiones bajos. A continuation se listan 
algunos especialmente utiles. 

init (self, args) 

Metodo llamado despues de crear el objeto para realizar tareas de 
initialization. 

new (els, args) 

Metodo exclusivo de las clases de nuevo estilo que se ejecuta antes que 

init y que se encarga de construir y devolver el objeto en si. Es 

equivalente a los constructores de C++ o Java. Se trata de un metodo 
estatico, es decir, que existe con independencia de las instancias de 
la clase: es un metodo de clase, no de objeto, y por lo tanto el primer 
parametro no es self, sino la propia clase: els. 

__del__(self ) 

Metodo llamado cuando el objeto va a ser borrado. Tambien llamado 
destructor, se utiliza para realizar tareas de limpieza. 

__str__(self ) 

Metodo llamado para crear una cadena de texto que represente a nues- 
tro objeto. Se utiliza cuando usamos print para mostrar nuestro objeto 
o cuando usamos la funcion str (ob j ) para crear una cadena a partir de 
nuestro objeto. 

cmp (self, otro) 

Metodo llamado cuando se utilizan los operadores de comparacion 
para comprobar si nuestro objeto es menor, mayor o igual al objeto 
pasado como parametro. Debe devolver un numero negativo si nuestro 
objeto es menor, cero si son iguales, y un numero positivo si nuestro 
objeto es mayor. Si este metodo no esta definido y se intenta com- 
parar el objeto mediante los operadores <, <=, > o >= se lanzara una 
exception. Si se utilizan los operadores == o ! = para comprobar si dos 
objetos son iguales, se comprueba si son el mismo objeto (si tienen el 
mismo id). 

len (self) 

Metodo llamado para comprobar la longitud del objeto. Se utiliza, por 
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ejemplo, cuando se llama a la funcion len(ob j ) sobre nuestro objeto. 
Como es de suponer, el metodo debe devolver la longitud del objeto. 

Existen bastantes mas metodos especiales, que permite entre otras 
cosas utilizar el mecanismo de slicing sobre nuestro objeto, utilizar 
los operadores aritmeticos o usar la sintaxis de diccionarios, pero un 
estudio exhaustivo de todos los metodos queda fuera del proposito del 
capitulo. 
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En los capitulos dedicados a los tipos simples y las colecciones veiamos 
por primera vez algunos de los objetos del lenguaje Python: numeros, 
booleanos, cadenas de texto, diccionarios, listas y tuplas. 

Ahora que sabemos que son las clases, los objetos, las funciones, y los 
metodos es el momento de revisitar estos objetos para descubrir su 
verdadero potencial. 

Veremos a continuation algunos metodos utiles de estos objetos. Evi- 
dentemente, no es necesario memorizarlos, pero si, al menos, recordar 
que existen para cuando sean necesarios. 

Diccionarios 

D.get(k[, d]) 

Busca el valor de la clave k en el diccionario. Es equivalente a utilizar 
D [ k ] pero al utilizar este metodo podemos indicar un valor a devolver 
por defecto si no se encuentra la clave, mientras que con la sintaxis 
D [ k ] , de no existir la clave se lanzaria una exception. 

D.has_key(k) 

Comprueba si el diccionario tiene la clave k. Es equivalente a la sin- 
taxis k in D. 

D. i terns ( ) 

Devuelve una lista de tuplas con pares clave-valor. 
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D.keys( ) 

Devuelve una lista de las claves del diccionario. 
D.pop(k[, d]) 

Borra la clave k del diccionario y devuelve su valor. Si no se encuentra 
dicha clave se devuelve d si se especifico el parametro o bien se lanza 
una excepcion. 

D. values( ) 

Devuelve una lista de los valores del diccionario. 

Cadenas 

S.count(sub[ , startf, end]]) 

Devuelve el numero de veces que se encuentra sub en la cadena. Los 
parametros opcionales start y end definen una subcadena en la que 
buscar. 

S.find(sub[, startf, end]]) 

Devuelve la position en la que se encontro por primera vez sub en la 
cadena o -1 si no se encontro. 

S . join(sequence) 

Devuelve una cadena resultante de concatenar las cadenas de la se- 
cuencia seq separadas por la cadena sobre la que se llama el metodo. 

S.partition(sep) 

Busca el separador sep en la cadena y devuelve una tupla con la sub- 
cadena hasta dicho separador, el separador en si, y la subcadena del 
separador hasta el final de la cadena. Si no se encuentra el separador, la 
tupla contendra la cadena en si y dos cadenas vacias. 

S.replace(old, new[, count]) 

Devuelve una cadena en la que se han reemplazado todas las ocurren- 
cias de la cadena old por la cadena new. Si se especifica el parametro 
count, este indica el numero maximo de ocurrencias a reemplazar. 

S.split([sep [ ,maxsplit] ] ) 

Devuelve una lista conteniendo las subcadenas en las que se divide 
nuestra cadena al dividirlas por el delimitador sep. En el caso de que 
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no se especifique sep, se usan espacios. Si se especifica maxsplit, este 
indica el numero maximo de particiones a realizar. 



Listas 

L.append(object) 

Anade un objeto al final de la lista. 

L.count(value) 

Devuelve el numero de veces que se encontro value en la lista. 
L.extend(iterable) 

Anade los elementos del iterable a la lista. 
L. index(value[ , startf, stop]]) 

Devuelve la position en la que se encontro la primera ocurrencia de 
value. Si se especifican, start y stop definen las posiciones de initio y 
fin de una sublista en la que buscar. 

L. insert(index, object) 

Inserta el objeto object en la position index. 

L . pop( [index] ) 

Devuelve el valor en la position index y lo elimina de la lista. Si no se 
especifica la position, se utiliza el ultimo elemento de la lista. 

L . remove(value) 

Eliminar la primera ocurrencia de value en la lista. 
L . reverse( ) 

Invierte la lista. Esta funcion trabaja sobre la propia lista desde la que 
se invoca el metodo, no sobre una copia. 

L.sort(cmp=None, key=None, reverse=False) 

Ordena la lista. Si se especifica cmp, este debe ser una funcion que tome 
como parametro dos valores x e y de la lista y devuelva -1 si x es menor 
que y, 0 si son iguales y 1 si x es mayor que y. 

El parametro reverse es un booleano que indica si se debe ordenar 
la lista de forma inversa, lo que seria equivalente a llamar primero a 
L . sort ( ) y despues a L . reverse ( ). 
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Por ultimo, si se especifica, el parametro key debe ser una funcion que 
tome un elemento de la lista y devuelva una clave a utilizar a la hora de 
comparar, en lugar del elemento en si. 
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La programacion funcional es un paradigma en el que la programa- 
cion se basa casi en su totalidad en funciones, entendiendo el concepto 
de funcion segun su defmicion matematica, y no como los simples 
subprogramas de los lenguajes imperativos que hemos visto hasta 
ahora. 

En los lenguajes funcionales puros un programa consiste exclusiva- 
mente en la aplicacion de distintas funciones a un valor de entrada 
para obtener un valor de salida. 

Python, sin ser un lenguaje puramente funcional incluye varias caracte- 
risticas tomadas de los lenguajes funcionales como son las funciones de 
orden superior o las funciones lambda (funciones anonimas). 

Funciones de orden superior 

El concepto de funciones de orden superior se refiere al uso de fun- 
ciones como si de un valor cualquiera se tratara, posibilitando el pasar 
funciones como parametros de otras funciones o devolver funciones 
como valor de retorno. 

Esto es posible porque, como hemos insistido ya en varias ocasiones, 
en Python todo son objetos. Y las funciones no son una exception. 

Veamos un pequeno ejemplo 

def saludar ( lang) : 
def saludar_es( ) : 
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print "Hola" 

def saludar_en( ) : 
print "Hi" 

def saludar_f r( ) : 
print "Salut" 

lang_func = {"es": saludar_es, 

"en": saludar_en, 

"fr": saludar_fr} 
return lang_f unc[ lang] 

f = saludar("es") 
f() 

Como podemos observar lo primero que hacemos en nuestro pequeno 
programa es llamar a la funcion saludar con un parametro "es". En la 
funcion saludar se definen varias funciones: saludar_es, saludar_en y 
saludar_f r y a continuation se crea un diccionario que tiene como cla- 
ves cadenas de texto que identifican a cada lenguaje, y como valores las 
funciones. El valor de retorno de la funcion es una de estas funciones. 
La funcion a devolver viene determinada por el valor del parametro 
lang que se paso como argumento de saludar. 

Como el valor de retorno de saludar es una funcion, como hemos 
visto, esto quiere decir que f es una variable que contiene una funcion. 
Podemos entonces llamar a la funcion a la que se refiere f de la forma 
en que llamariamos a cualquier otra funcion, anadiendo unos parente- 
sis y, de forma opcional, una serie de parametros entre los parentesis. 

Esto se podria acortar, ya que no es necesario almacenar la funcion que 
nos pasan como valor de retorno en una variable para poder llamarla: 

»> saludar ( "en" )( ) 
Hi 

»> saludar("fr")() 
Salut 

En este caso el primer par de parentesis indica los parametros de la 
funcion saludar, y el segundo par, los de la funcion devuelta por salu- 
dar. 
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Iteraciones de orden superior so- 
bre listas 

Una de las cosas mas interesantes que podemos hacer con nuestras 
funciones de orden superior es pasarlas como argumentos de las fun- 
ciones map, filter y reduce. Estas funciones nos permiten sustituir los 
bucles tipicos de los lenguajes imperativos mediante construcciones 
equivalentes. 



map(function, sequenced sequence, ...]) 

La funcion map aplica una funcion a cada elemento de una secuencia y 
devuelve una lista con el resultado de aplicar la funcion a cada elemen- 
to. Si se pasan como parametros n secuencias, la funcion tendra que 
aceptar n argumentos. Si alguna de las secuencias es mas pequena que 
las demas, el valor que le llega a la funcion function para posiciones 
mayores que el tamano de dicha secuencia sera None. 

A continuation podemos ver un ejemplo en el que se utiliza map para 
elevar al cuadrado todos los elementos de una lista: 



def cuadrado(n): 
return n ** 2 



1 = [1, 2, 3] 

12 = map(cuadrado, 1) 



filter(function, sequence) 

La funcion filter verifica que los elementos de una secuencia cum- 
plan una determinada condition, devolviendo una secuencia con los 
elementos que cumplen esa condition. Es decir, para cada elemento de 
sequence se aplica la funcion function; si el resultado es True se anade 
a la lista y en caso contrario se descarta. 

A continuation podemos ver un ejemplo en el que se utiliza filter 
para conservar solo los numeros que son pares. 

def es_par(n) : 

return (n % 2.0 == 0) 

1 = [1, 2, 3] 
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12 = f ilter(es_par , 1) 

reduce(function, sequenced initial]) 

La funcion reduce aplica una funcion a pares de elementos de una 
secuencia hasta dejarla en un solo valor. 

A continuation podemos ver un ejemplo en el que se utiliza reduce 
para sumar todos los elementos de una lista. 

def sumar(x , y) : 
return x + y 

1 = [1, 2, 3] 

12 = reduce(sumar , 1) 

Funciones lambda 

El operador lambda sirve para crear funciones anonimas en linea. Al ser 
funciones anonimas, es decir, sin nombre, estas no podran ser referen- 
ciadas mas tarde. 

Las funciones lambda se construyen mediante el operador lambda, los 
parametros de la funcion separados por comas (atencion, SIN parente- 
sis), dos puntos ( : ) y el codigo de la funcion. 

Esta construction podrian haber sido de utilidad en los ejemplos an- 
teriores para reducir codigo. El programa que utilizamos para explicar 
filter, por ejemplo, podria expresarse asi: 

1 = [1, 2, 3] 

12 = f ilter(lambda n: n % 2.0 == 0, 1) 

Comparemoslo con la version anterior: 

def es_par(n): 

return (n % 2.0 == 0) 

1 = [1, 2, 3] 

12 = f ilter(es_par , 1) 

Las funciones lambda estan restringidas por la sintaxis a una sola 
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expresion. 

Comprension de listas 

En Python 3000 map, filter y reduce perderan importancia. Y aun- 
que estas funciones se mantendran, reduce pasara a formar parte del 
modulo functools, con lo que quedara fuera de las funciones dispo- 
nibles por defecto, y map y filter se desaconsejaran en favor de las list 
comprehensions o comprension de listas. 

La comprension de listas es una caracteristica tomada del lenguaje de 
programacion funcional Haskell que esta presente en Python desde la 
version 2.0 y consiste en una construction que permite crear listas a 
partir de otras listas. 

Cada una de estas construcciones consta de una expresion que deter- 
mina como modificar el elemento de la lista original, seguida de una o 
varias clausulas for y opcionalmente una o varias clausulas if. 

Veamos un ejemplo de como se podria utilizar la comprension de listas 
para elevar al cuadrado todos los elementos de una lista, como hicimos 
en nuestro ejemplo de map. 

12 = [n ** 2 for n in 1] 

Esta expresion se leeria como "para cada n en 1 haz n ** 2". Como 
vemos tenemos primero la expresion que modifica los valores de la lista 
original (n ** 2), despues el for, el nombre que vamos a utilizar para 
referirnos al elemento actual de la lista original, el in, y la lista sobre la 
que se itera. 

El ejemplo que utilizamos para la funcion filter (conservar solo los 
numeros que son pares) se podria expresar con comprension de listas 
asi: 

12 = [n for n in 1 if n % 2.0 == 0] 

Veamos por ultimo un ejemplo de compresion de listas con varias 
clausulas for: 
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1 = [0, 1, 2, 3] 

m = ["a", "b"] 

n = [s * v for s in m 
for v in I 
if v > 0] 



Esta construction serfa equivalente a una serie de for- in anidados: 

1 = [0, 1, 2, 3] 
m = ["a", "b"] 
n = [] 

for s in m: 

for v in 1: 
if v > 0: 

n.append(s* v) 



Generadores 

Las expresiones generadoras funcionan de forma muy similar a la 
comprension de listas. De hecho su sintaxis es exactamente igual, a 
exception de que se utilizan parentesis en lugar de corchetes: 

12 = (n ** 2 for n in 1) 



Sin embargo las expresiones generadoras se diferencian de la compren- 
sion de listas en que no se devuelve una lista, sino un generador. 

»> 12 = [n ** 2 for n in 1] 

»> 12 

[0, 1, 4, 9] 

»> 12 = (n ** 2 for n in 1) 
»> 12 

generator object at 0x00E33210> 



Un generador es una clase especial de funcion que genera valores sobre 
los que iterar. Para devolver el siguiente valor sobre el que iterar se 
utiliza la palabra clave yield en lugar de return. Veamos por ejemplo 
un generador que devuelva numeros de n a m con un salto s. 

def mi_generador(n , m, s): 
while(n <= m) : 
yield n 
n += s 
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»> x = mi_generador(0, 5, 1) 

>>> x 

<generator object at 0x00E25710> 

El generador se puede utilizar en cualquier lugar donde se necesite un 
objeto iterable. Por ejemplo en un f or-in: 

for n in mi_generador(0 , 5, 1): 
print n 

Como no estamos creando una lista completa en memoria, sino gene- 
rando un solo valor cada vez que se necesita, en situaciones en las que 
no sea necesario tener la lista completa el uso de generadores puede 
suponer una gran diferencia de memoria. En todo caso siempre es po- 
sible crear una lista a partir de un generador mediante la funcion list: 

lista = list(mi_generador) 

Decoradores 

Un decorador no es es mas que una funcion que recibe una funcion 
como parametro y devuelve otra funcion como resultado. Por ejem- 
plo podriamos querer anadir la funcionalidad de que se imprimiera el 
nombre de la funcion llamada por motivos de depuracion: 

def mi_decorador( funcion) : 
def nueva(*args) : 

print "Llamada a la funcion", funcion. name 

retorno = funcion(*args) 

return retorno 
return nueva 

Como vemos el codigo de la funcion mi_decorador no hace mas que 
crear una nueva funcion y devolverla. Esta nueva funcion imprime el 
nombre de la funcion a la que "decoramos", ejecuta el codigo de dicha 
funcion, y devuelve su valor de retorno. Es decir, que si llamaramos 
a la nueva funcion que nos devuelve mi_decorador, el resultado seria 
el mismo que el de llamar directamente a la funcion que le pasamos 
como parametro, exceptuando el que se imprimiria ademas el nombre 
de la funcion. 
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Supongamos como ejemplo una funcion imp que no hace otra cosa que 
mostrar en pantalla la cadena pasada como parametro. 

»> imp( "hola" ) 
hola 

»> mi_decorador ( imp) ( "hola" ) 
Llamada a la funcion imp 
hola 

La sintaxis para llamar a la funcion que nos devuelve mi_decorador no 
es muy clara, aunque si lo estudiamos detenidamente veremos que no 
tiene mayor complicacion. Primero se llama a la funcion que decora 
con la funcion a decorar: mi_decor ador ( imp ) ; y una vez obtenida la 
funcion ya decorada se la puede llamar pasando el mismo parametro 
que se paso anteriormente: mi_decorador( imp) ( "hola" ) 

Esto se podria expresar mas claramente precediendo la defmicion de la 
funcion que queremos decorar con el signo @ seguido del nombre de la 
funcion decoradora: 

@mi_decorador 
def imp(s): 
print s 

De esta forma cada vez que se llame a imp se estara llamando realmen- 
te a la version decorada. Python incorpora esta sintaxis desde la version 
2.4 en adelante. 

Si quisieramos aplicar mas de un decorador bastaria anadir una nueva 
linea con el nuevo decorador. 

@>otro_decorador 
@mi_decorador 
def imp(s): 
print s 

Es importante advertir que los decoradores se ejecutaran de abajo a 
arriba. Es decir, en este ejemplo primero se ejecutaria mi_decorador y 
despues otro_decorador. 
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Las excepciones son errores detectados por Python durante la eje- 
cucion del programa. Cuando el interprete se encuentra con una 
situacion excepcional, como el intentar dividir un numero entre 0 o 
el intentar acceder a un archivo que no existe, este genera o lanza una 
excepcion, informando al usuario de que existe algun problema. 

Si la excepcion no se captura el flujo de ejecucion se interrumpe y se 
muestra la informacion asociada a la excepcion en la consola de forma 
que el programador pueda solucionar el problema. 

Veamos un pequeno programa que lanzaria una excepcion al intentar 
dividir 1 entre 0. 

def division(a , b) : 
return a / b 

def calcular( ) : 
divisional, 0) 

calcular ( ) 



Si lo ejecutamos obtendremos el siguiente mensaje de error: 

$ python ejemplo.py 
Traceback (most recent call last): 
File "ejemplo.py", line 7, in 
calcular ( ) 

File "ejemplo.py", line 5, in calcular 
division(1, 0) 

File "ejemplo.py", line 2, in division 
a / b 

ZeroDivisionError : integer division or modulo by zero 



Lo primero que se muestra es el trazado de pila o traceback, que con- 
siste en una lista con las llamadas que provocaron la excepcion. Como 
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vemos en el trazado de pila, el error estuvo causado por la llamada a 
calcular( ) de la lmea 7, que a su vez llama a division( 1 , 0) en la 
lmea 5 y en ultima instancia por la ejecucion de la sentencia a / b de 
la linea 2 de division. 

A continuation vemos el tipo de la excepcion, ZeroDivisionError, 
junto a una description del error: "integer division or modulo by zero" 
(modulo o division entera entre cero). 

En Python se utiliza una construction try-except para capturar y 
tratar las excepciones. El bloque try (intentar) define el fragmento de 
codigo en el que creemos que podria producirse una excepcion. El blo- 
que except (excepcion) permite indicar el tratamiento que se llevara a 
cabo de producirse dicha excepcion. Muchas veces nuestro tratamiento 
de la excepcion consistira simplemente en imprimir un mensaje mas 
amigable para el usuario, otras veces nos interesara registrar los errores 
y de vez en cuando podremos establecer una estrategia de resolution 
del problema. 

En el siguiente ejemplo intentamos crear un objeto f de tipo fichero. 
De no existir el archivo pasado como parametro, se lanza una excep- 
cion de tipo IOError, que capturamos gracias a nuestro try-except. 

try: 

f = file("archivo.txt") 
except : 

print "El archivo no existe" 

Python permite utilizar varios except para un solo bloque try, de 
forma que podamos dar un tratamiento distinto a la excepcion de- 
pendiendo del tipo de excepcion de la que se trate. Esto es una buena 
practica, y es tan sencillo como indicar el nombre del tipo a continua- 
cion del except. 

try: 

num = int("3a") 

print no_existe 
except NameError: 

print "La variable no existe" 
except ValueError: 

print "El valor no es un numero" 
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Cuando se lanza una exception en el bloque try, se busca en cada una 
de las clausulas except un manejador adecuado para el tipo de error 
que se produjo. En caso de que no se encuentre, se propaga la excep- 
tion. 



Ademas podemos hacer que un mismo except sirva para tratar mas 
de una exception usando una tupla para listar los tipos de error que 
queremos que trate el bloque: 

try: 

num = int("3a") 
print no_existe 
except (NameError, ValueError): 
print "Ocurrio un error" 

La construction try-except puede contar ademas con una clausula 
else, que define un fragmento de codigo a ejecutar solo si no se ha 
producido ninguna exception en el try. 

try: 

num = 33 
except : 

print "Hubo un error ! " 
else: 

print "Todo esta bien" 

Tambien existe una clausula finally que se ejecuta siempre, se pro- 
duzca o no una exception. Esta clausula se suele utilizar, entre otras 
cosas, para tareas de limpieza. 

try: 

z = x / y 
except ZeroDivisionError : 

print "Division por cero" 
finally: 

print "Limpiando" 

Tambien es interesante comentar que como programadores podemos 
crear y lanzar nuestras propias excepciones. Basta crear una clase que 
herede de Exception o cualquiera de sus hijas y lanzarla con raise. 

class MiError(Exception) : 

def init (self, valor): 

self .valor = valor 
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def __str__(self ) : 

return "Error " + str(self .valor) 

try: 

if resultado > 20: 
raise MiError(33) 
except MiError, e: 
print e 

Por ultimo, a continuation se listan a modo de referencia las excepcio- 
nes disponibles por defecto, asi como la clase de la que deriva cada una 
de ellas entre parentesis. 

BaseException: Clase de la que heredan todas las excepciones. 

Except ion (BaseExcept ion): Super clase de todas las excepciones que 
no sean de salida. 

GeneratorExit(Exception): Se pide que se saiga de un generador. 

StandardError (Exception): Clase base para todas las excepciones que 
no tengan que ver con salir del interprete. 

ArithmeticError(StandardError): Clase base para los errores aritme- 
ticos. 

FloatingPointError (ArithmeticError ): Error en una operation de 
coma flotante. 

Overf lowError (ArithmeticError ): Resultado demasiado grande para 
poder representarse. 

ZeroDivisionError(ArithmeticError ): Lanzada cuando el segundo 
argumento de una operation de division o modulo era 0. 

AssertionError(StandardError ): Fallo la condition de un estamento 
assert. 

AttributeError(StandardError ): No se encontro el atributo. 
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EOFError(StandardError ): Se intento leer mas alia del final de fichero. 

EnvironmentError (StandardError ): Clase padre de los errores relacio- 
nados con la entrada/salida. 

I OError (EnvironmentError ): Error en una operation de entrada/salida. 

OSError (EnvironmentError ): Error en una llamada a sistema. 

WindowsError (OSError ): Error en una llamada a sistema en Windows. 

ImportError(StandardError ): No se encuentra el modulo o el elemen- 
to del modulo que se queria importar. 

LookupError(StandardError ): Clase padre de los errores de acceso. 

IndexError (LookupError ): Elindice de la secuencia esta fuera del 
rango posible. 

KeyError(LookupError ): La clave no existe. 

MemoryError(StandardError ): No queda memoria suficiente. 

NameError(StandardError): No se encontro ningun elemento con ese 
nombre. 

UnboundLoca 1 Error (NameError): El nombre no esta asociado a ninguna 
variable. 

Ref erenceError(StandardError ): El objeto no tiene ninguna referen- 
da fuerte apuntando hacia el. 

RuntimeError (StandardError ): Error en tiempo de ejecucion no espe- 
cificado. 

NotlmplementedError(RuntimeError): Ese metodo o funcion no esta 
implementado. 

SyntaxError(StandardError ): Clase padre para los errores sintacticos. 
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IndentationError (SyntaxError ): Error en la indentation del archivo. 

TabError( IndentationError ): Error debido a la mezcla de espacios y 
tabuladores. 

SystemError(StandardError ): Error interno del interprete. 

TypeError (StandardError ): Tipo de argumento no apropiado. 

ValueError (StandardError ): Valor del argumento no apropiado. 

UnicodeError (ValueError ): Clase padre para los errores relacionados 
con Unicode. 

UnicodeDecodeError (UnicodeError ): Error de decodificacion Unicode. 

UnicodeEncodeError (UnicodeError ): Error de codification Unicode. 

UnicodeTranslateError (UnicodeError ): Error de traduction Unicode. 

StopIteration(Exception): Se utiliza para indicar el final del iterador. 

Warning(Exception): Clase padre para los avisos. 

DeprecationWarning(Warning): Clase padre para avisos sobre caracte- 
risticas obsoletas. 

FutureWarning(Warning): Aviso. La semantica de la construction cam- 
biara en un future. 

ImportWarning(Warning): Aviso sobre posibles errores a la hora de 
importar. 

PendingDeprecationWarning(Warning): Aviso sobre caracteristicas que 
se marcaran como obsoletas en un future proximo. 

RuntimeWarning(Warning): Aviso sobre comportmaientos dudosos en 
tiempo de ejecucion. 
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SyntaxWarning(Warning): Aviso sobre sintaxis dudosa. 

UnicodeWarning(Warning): Aviso sobre problemas relacionados con 
Unicode, sobre todo con problemas de conversion. 

UserWarning(Warning): Clase padre para avisos creados por el progra- 
mador. 

Keyboardlnterrupt (BaseException): El programa fue interrumpido 
por el usuario. 

SystemExit(BaseException): Petition del interprete para terminar la 
ejecucion. 
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Modulos 

Para facilitar el mantenimiento y la lectura los programas demasiado 
largos pueden dividirse en modulos, agrupando elementos relaciona- 
dos. Los modulos son entidades que permiten una organization y divi- 
sion logica de nuestro codigo. Los ficheros son su contrapartida flsica: 
cada archivo Python almacenado en disco equivale a un modulo. 

Vamos a crear nuestro primer modulo entonces creando un pequeno 
archivo modulo.py con el siguiente contenido: 

def mi_f uncion( ) : 

print "una funcion" 

class MiClase: 

def init (self) : 

print "una clase" 

print "un modulo" 

Si quisieramos utilizar la funcionalidad definida en este modulo en 
nuestro programa tendriamos que importarlo. Para importar un mo- 
dulo se utiliza la palabra clave import seguida del nombre del modulo, 
que consiste en el nombre del archivo menos la extension. Como ejem- 
plo, creemos un archivo programa.py en el mismo directorio en el que 
guardamos el archivo del modulo (esto es importante, porque si no se 
encuentra en el mismo directorio Python no podra encontrarlo), con el 
siguiente contenido: 

import modulo 
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modulo.mi_funcion( ) 

El import no solo hace que tengamos disponible todo lo definido 
dentro del modulo, sino que tambien ejecuta el codigo del modulo. Por 
esta razon nuestro programa, ademas de imprimir el texto "una fun- 
cion" al Uamar a mi_f uncion, tambien imprimiria el texto "un modulo", 
debido al print del modulo importado. No se imprimiria, no obstante, 
el texto "una clase", ya que lo que se hizo en el modulo fue tan solo 
definir de la clase, no instanciarla. 

La clausula import tambien permite importar varios modulos en la 
misma linea. En el siguiente ejemplo podemos ver como se importa 
con una sola clausula import los modulos de la distribution por defecto 
de Python os, que engloba funcionalidad relativa al sistema operativo; 
sys, con funcionalidad relacionada con el propio interprete de Python 
y time, en el que se almacenan funciones para manipular fechas y 
horas. 

import os, sys, time 
print time . asctime( ) 

Sin duda os habreis fijado en este y el anterior ejemplo en un detalle 
importante, y es que, como vemos, es necesario preceder el nombre de 
los objetos que importamos de un modulo con el nombre del modulo 
al que pertenecen, o lo que es lo mismo, el espacio de nombres en el 
que se encuentran. Esto permite que no sobreescribamos accidental- 
mente algun otro objeto que tuviera el mismo nombre al importar otro 
modulo. 

Sin embargo es posible utilizar la construction f rom-import para 
ahorrarnos el tener que indicar el nombre del modulo antes del objeto 
que nos interesa. De esta forma se importa el objeto o los objetos que 
indiquemos al espacio de nombres actual. 

from time import asctime 
print asctime() 
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Aunque se considera una mala practica, tambien es posible importar 
todos los nombres del modulo al espacio de nombres actual usando el 
caracter *: 

from time import * 

Ahora bien, recordareis que a la hora de crear nuestro primer modulo 
insisti en que lo guardarais en el mismo directorio en el que se en- 
contraba el programa que lo importaba. Entonces, <jc6mo podemos 
importar los modulos os, sys o time si no se encuentran los archivos 
os . py, sys . py y t ime . py en el mismo directorio? 

A la hora de importar un modulo Python recorre todos los directorios 
indicados en la variable de entorno PYTHONPATH en busca de un archivo 
con el nombre adecuado. El valor de la variable PYTHONPATH se puede 
consultar desde Python mediante sys .path 

»> import sys 
>» sys. path 

De esta forma para que nuestro modulo estuviera disponible para 
todos los programas del sistema bastaria con que lo copiaramos a uno 
de los directorios indicados en PYTHONPATH. 

En el caso de que Python no encontrara ningun modulo con el nom- 
bre especificado, se lanzaria una exception de tipo ImportError. 

Por ultimo es interesante comentar que en Python los modulos 
tambien son objetos; de tipo module en concreto. Por supuesto esto 
significa que pueden tener atributos y metodos. Uno de sus atributos, 

name , se utiliza a menudo para incluir codigo ejecutable en un 

modulo pero que este solo se ejecute si se llama al modulo como pro- 
grama, y no al importarlo. Para lograr esto basta saber que cuando se 

ejecuta el modulo directamente name tiene como valor " main ", 

mientras que cuando se importa, el valor de name es el nombre del 

modulo: 

print "Se muestra siempre" 

if name == " main ": 

print "Se muestra si no es importacion" 
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Otro atributo interesante es doc , que, como en el caso de fun- 

ciones y clases, sirve a modo de documentation del objeto (docstring 
o cadena de documentation). Su valor es el de la primera Hnea del 
cuerpo del modulo, en el caso de que esta sea una cadena de texto; en 
caso contrario valdra None. 

Paquetes 

Si los modulos sirven para organizar el codigo, los paquetes sirven para 
organizar los modulos. Los paquetes son tipos especiales de modulos 
(ambos son de tipo module) que permiten agrupar modulos relacio- 
nados. Mientras los modulos se corresponden a nivel fisico con los 
archivos, los paquetes se representan mediante directorios. 

En una aplicacion cualquiera podriamos tener, por ejemplo, un paque- 
te iu para la interfaz o un paquete bbdd para la persistencia a base de 
datos. 

Para hacer que Python trate a un directorio como un paquete es nece- 

sario crear un archivo init .py en dicha carpeta. En este archivo se 

pueden definir elementos que pertenezcan a dicho paquete, como una 
constante DRIVER para el paquete bbdd, aunque habitualmente se trata- 
ra de un archivo vacio. Para hacer que un cierto modulo se encuentre 
dentro de un paquete, basta con copiar el archivo que define el modulo 
al directorio del paquete. 

Como los modulos, para importar paquetes tambien se utiliza import 
y f rom-import y el caracter . para separar paquetes, subpaquetes y 
modulos. 

import paq.subpaq. modulo 
paq.subpaq. modulo. f unc( ) 

A lo largo de los proximos capitulos veremos algunos modulos y pa- 
quetes de utilidad. Para encontrar algun modulo o paquete que cubra 
una cierta necesidad, puedes consultar la lista de PyPI (Python Pac- 
kage Index) en http://pypi.python.org/, que cuenta a la hora de escribir 
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estas li'neas, con mas de 4000 paquetes distintos. 
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Nuestros programas serian de muy poca utilidad si no fueran capaces 
de interaccionar con el usuario. En capi'tulos anteriores vimos, de pasa- 
da, el uso de la palabra clave print para mostrar mensajes en pantalla. 

En esta lection, ademas de describir mas detalladamente del uso de 
print para mostrar mensajes al usuario, aprenderemos a utilizar las 
funciones input y raw_input para pedir information, asi como los 
argumentos de linea de comandos y, por ultimo, la entrada/salida de 
ficheros. 

Entrada estandar 

La forma mas sencilla de obtener information por parte del usuario 
es mediante la funcion raw_input. Esta funcion toma como parame- 
tro una cadena a usar como prompt (es decir, como texto a mostrar al 
usuario pidiendo la entrada) y devuelve una cadena con los caracteres 
introducidos por el usuario hasta que pulso la tecla Enter. Veamos un 
pequeno ejemplo: 

nombre = raw_input( "Como te llamas? ") 
print "Encantado, " + nombre 

Si necesitaramos un entero como entrada en lugar de una cadena, por 
ejemplo, podriamos utilizar la funcion int para convertir la cadena a 
entero, aunque seria conveniente tener en cuenta que puede lanzarse 
una exception si lo que introduce el usuario no es un numero. 

try: 

edad = raw_input ( "Cuantos anyos tienes? ") 
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dias = int(edad) * 365 
print "Has vivido " + str(dias) + " dias" 
except ValueError: 

print "Eso no es un numero" 

La funcion input es un poco mas complicada. Lo que hace esta fun- 
cion es utilizar raw_input para leer una cadena de la entrada estandar, 
y despues pasa a evaluarla como si de codigo Python se tratara; por lo 
tanto input deberia tratarse con sumo cuidado. 

Parametros de Imea de comando 

Ademas del uso de input y raw_input el programador Python cuen- 
ta con otros metodos para obtener datos del usuario. Uno de ellos es 
el uso de parametros a la hora de llamar al programa en la h'nea de 
comandos. Por ejemplo: 

python editor. py hola.txt 

En este caso hoi a . txt seria el parametro, al que se puede acceder a 
traves de la lista sys . argv, aunque, como es de suponer, antes de poder 
utilizar dicha variable debemos importar el modulo sys. sys . argv[0] 
contiene siempre el nombre del programa tal como lo ha ejecutado el 
usuario, sys . argv[ 1 ], si existe, seria el primer parametro; sys . argv[ 2 ] 
el segundo, y asi sucesivamente. 

import sys 

if (len(sys.argv) > 1): 

print "Abriendo " + sys.argv[1] 
else : 

print "Debes indicar el nombre del archivo" 

Existen modulos, como optparse, que facilitan el trabajo con los argu- 
mentos de la linea de comandos, pero explicar su uso queda fuera del 
objetivo de este capitulo. 

Salida estandar 

La forma mas sencilla de mostrar algo en la salida estandar es median- 
te el uso de la sentencia print, como hemos visto multitud de veces en 
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ejemplos anteriores. En su forma mas basica a la palabra clave print le 
sigue una cadena, que se mostrara en la salida estandar al ejecutarse el 
estamento. 

»> print "Hola mundo" 
Hola mundo 

Despues de imprimir la cadena pasada como parametro el puntero se 
situa en la siguiente linea de la pantalla, por lo que el print de Python 
funciona igual que el print In de Java. 

En algunas funciones equivalentes de otros lenguajes de programacion 
es necesario anadir un caracter de nueva linea para indicar explicita- 
mente que queremos pasar a la siguiente linea. Este es el caso de la 
funcion printf de C o la propia funcion print de Java. 

Ya explicamos el uso de estos caracteres especiales durante la explica- 
tion del tipo cadena en el capitulo sobre los tipos basicos de Python. 
La siguiente sentencia, por ejemplo, imprimiria la palabra "Hola", 
seguida de un renglon vacio (dos caracteres de nueva linea, ' \ n '), y 
a continuation la palabra "mundo" indentada (un caracter tabulador, 
'\t'). 

print "Hola\n\n\tmundo" 

Para que la siguiente impresion se realizara en la misma linea tendria- 
mos que colocar una coma al final de la sentencia. Comparemos el 
resultado de este codigo: 

»> for i in range(3) : 
»> . . .print i , 
0 1 2 

Con el de este otro, en el que no utiliza una coma al final de la senten- 
cia: 

»> for i in range(3) : 

>>> . . .print i 

0 

1 

2 
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Este mecanismo de colocar una coma al final de la sentencia funcio- 
na debido a que es el simbolo que se utiliza para separar cadenas que 
queramos imprimir en la misma linea. 

»> print "Hola", "mundo" 
Hola mundo 

Esto se diferencia del uso del operador + para concatenar las cadenas 
en que al utilizar las comas print introduce automaticamente un espa- 
cio para separar cada una de las cadenas. Este no es el caso al utilizar 
el operador +, ya que lo que le llega a print es un solo argumento: una 
cadena ya concatenada. 

»> print "Hola" + "mundo" 
Holamundo 

Ademas, al utilizar el operador + tendriamos que convertir antes cada 
argumento en una cadena de no serlo ya, ya que no es posible concate- 
nar cadenas y otros tipos, mientras que al usar el primer metodo no es 
necesaria la conversion. 

»> print "Cuesta", 3, "euros" 
Cuesta 3 euros 

»> print "Cuesta" + 3 + "euros" 

<type 'exceptions. TypeError'>: cannot concatenate 'str' and 
' int 1 objects 

La sentencia print, o mas bien las cadenas que imprime, permiten 
tambien utilizar tecnicas avanzadas de formateo, de forma similar al 
sprintf de C. Veamos un ejemplo bastante simple: 

print "Hola %s" % "mundo" 

print "%s %s" % ("Hola", "mundo") 

Lo que hace la primera linea es introducir los valores a la derecha del 
simbolo % (la cadena "mundo") en las posiciones indicadas por los espe- 
cificadores de conversion de la cadena a la izquierda del simbolo %, tras 
convertirlos al tipo adecuado. 

En la segunda linea, vemos como se puede pasar mas de un valor a 
sustituir, por medio de una tupla. 
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En este ejemplo solo tenemos un especificador de conversion: %s. 

Los especificadores mas sencillos estan formados por el sfmbolo % 
seguido de una letra que indica el tipo con el que formatear el valor 
Por ejemplo: 



Especificador 


Formato 


%s 


Cadena 


%d 


Entero 


%o 


Octal 


%x 


Hexadecimal 


%f 


Real 



Se puede introducir un numero entre el%y el caracter que indica el 
tipo al que formatear, indicando el numero mi'nimo de caracteres que 
queremos que ocupe la cadena. Si el tamano de la cadena resultante 
es menor que este numero, se anadiran espacios a la izquierda de la 
cadena. En el caso de que el numero sea negativo, ocurrira exactamente 
lo mismo, solo que los espacios se anadiran a la derecha de la cadena. 

»> print "%10s mundo" % "Hola" 

Hola mundo 

»> print "%-10s mundo" % "Hola" 
Hola mundo 

En el caso de los reales es posible indicar la precision a utilizar prece- 
diendo la f de un punto seguido del numero de decimales que quere- 
mos mostrar: 

»> from math import pi 
»> print "%.4f" % pi 
3. 1416 

La misma sintaxis se puede utilizar para indicar el numero de caracte- 
res de la cadena que queremos mostrar 

»> print "%.4s" % "hola mundo" 
hola 
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Archivos 



Los ficheros en Python son objetos de tipo file creados mediante la 
funcion open (abrir). Esta funcion toma como parametros una cadena 
con la ruta al fichero a abrir, que puede ser relativa o absoluta; una 
cadena opcional indicando el modo de acceso (si no se especifica se 
accede en modo lectura) y, por ultimo, un entero opcional para especi- 
flcar un tamano de buffer distinto del utilizado por defecto. 

El modo de acceso puede ser cualquier combination logica de los 
siguientes modos: 

• ' r ' : read, lectura. Abre el archivo en modo lectura. El archivo tiene 
que existir previamente, en caso contrario se lanzara una exception 
de tipo IOError. 

• ' w ' : write, escritura. Abre el archivo en modo escritura. Si el archi- 
vo no existe se crea. Si existe, sobreescribe el contenido. 

• ' a ' : append, anadir. Abre el archivo en modo escritura. Se diferen- 
cia del modo ' w 1 en que en este caso no se sobreescribe el conteni- 
do del archivo, sino que se comienza a escribir al final del archivo. 

• ' b ' : binary, binario. 

• ' + ' : permite lectura y escritura simultaneas. 

• ' U ' : universal newline, saltos de linea universales. Permite trabajar 
con archivos que tengan un formato para los saltos de linea que no 
coincide con el de la plataforma actual (en Windows se utiliza el 
caracter CR LF, en Unix LF y en Mac OS CR). 

f = open("archivo.txt", "w") 

Tras crear el objeto que representa nuestro archivo mediante la funcion 
open podremos realizar las operaciones de lectura/escritura pertinen- 
tes utilizando los metodos del objeto que veremos en las siguientes 
secciones. 

Una vez terminemos de trabajar con el archivo debemos cerrarlo utili- 
zando el metodo close. 



Lectura de archivos 
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Para la lectura de archivos se utilizan los metodos read, readline y 
realines. 

El metodo read devuelve una cadena con el contenido del archivo o 
bien el contenido de los primeros n bytes, si se especifica el tamano 
maximo a leer. 

completo = f . read( ) 
parte = f2.read(512) 

El metodo readline sirve para leer las lineas del fichero una por una. 
Es decir, cada vez que se llama a este metodo, se devuelve el conteni- 
do del archivo desde el puntero hasta que se encuentra un caracter de 
nueva linea, incluyendo este caracter. 

while True: 

linea = f.readline() 
if not linea: break 
print linea 

Por ultimo, readlines, funciona leyendo todas las lineas del archivo y 
devolviendo una lista con las lineas leidas. 

Escritura de archivos 

Para la escritura de archivos se utilizan los metodo write y writelines. 
Mientras el primero funciona escribiendo en el archivo una cadena de 
texto que toma como parametro, el segundo toma como parametro una 
lista de cadenas de texto indicando las lineas que queremos escribir en 
el fichero. 

Mover el puntero de lectura/escritura 

Hay situaciones en las que nos puede interesar mover el puntero de 
lectura/escritura a una posicion determinada del archivo. Por ejemplo 
si queremos empezar a escribir en una posicion determinada y no al 
final o al principio del archivo. 

Para esto se utiliza el metodo seek que toma como parametro un nu- 
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mero positivo o negativo a utilizar como desplazamiento. Tambien es 
posible utilizar un segundo parametro para indicar desde donde quere- 
mos que se haga el desplazamiento: 0 indicara que el desplazamiento 
se refiere al principio del fichero (comportamiento por defecto), 1 se 
refiere a la position actual, y 2, al final del fichero. 

Para determinar la position en la que se encuentra actualmente el 
puntero se utiliza el metodo tell ( ), que devuelve un entero indicando 
la distancia en bytes desde el principio del fichero. 
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Las expresiones regulares, tambien llamadas regex o regexp, consisten 
en patrones que describen conjuntos de cadenas de caracteres. 

Algo parecido seria escribir en la linea de comandos de Windows 
dir *.exe 

' * . exe ' seria una "expresion regular" que describiria todas las cadenas 
de caracteres que empiezan con cualquier cosa seguida de '.exe', es 
decir, todos los archivos exe. 

El trabajo con expresiones regulares en Python se realiza mediante el 
modulo re, que data de Python 1.5 y que proporciona una sintaxis para 
la creacion de patrones similar a la de Perl. En Python 1.6 el modulo 
se reescribio para dotarlo de soporte de cadenas Unicode y mejorar su 
rendimiento. 

El modulo re contiene funciones para buscar patrones dentro de una 
cadena (search), comprobar si una cadena se ajusta a un determinado 
criterio descrito mediante un patron (match), dividir la cadena usando 
las ocurrencias del patron como puntos de ruptura (split) o para sus- 
tituir todas las ocurrencias del patron por otra cadena (sub). Veremos 
estas funciones y alguna mas en la proxima seccion, pero por ahora, 
aprendamos algo mas sobre la sintaxis de las expresiones regulares. 

Patrones 

La expresion regular mas sencilla consiste en una cadena simple, que 
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describe un conjunto compuesto tan solo por esa misma cadena. Por 
ejemplo, veamos como la cadena "python" coincide con la expresion 
regular "python" usando la funcion match: 

import re 

if re .match( "python" , "python"): 
print "cierto" 

Si quisieramos comprobar si la cadena es "python", " jython", 
"cython" o cualquier otra cosa que termine en "ython", podriamos 
utilizar el caracter comodin, el punto ' . 1 : 

re. match(" .ython" , "python") 
re. match(" .ython" , "jython") 

La expresion regular " .ython" describiria a todas las cadenas que con- 
sistan en un caracter cualquiera, menos el de nueva linea, seguido de 
"ython". Un caracter cualquiera y solo uno. No cero, ni dos, ni tres. 

En el caso de que necesitaramos el caracter ' . ' en la expresion regular, 
o cualquier otro de los caracteres especiales que veremos a continua- 
tion, tendriamos que escaparlo utilizando la barra invertida. 

Para comprobar si la cadena consiste en 3 caracteres seguidos de un 
punto, por ejemplo, podriamos utilizar lo siguiente: 

re .match( " . . . \ . " , "abc") 

Si necesitaramos una expresion que solo resultara cierta para las cade- 
nas "python", "jython" y "cython" y ninguna otra, podriamos utilizar 
el caracter ' I ' para expresar alternativa escribiendo los tres subpatro- 
nes completos: 

re .match ( "python I jython I cython" , "python" ) 

o bien tan solo la parte que pueda cambiar, encerrada entre parentesis, 
formando lo que se conoce como un grupo. Los grupos tienen una 
gran importancia a la hora de trabajar con expresiones regulares y este 
no es su unico uso, como veremos en la siguiente section. 
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re .match( " (p I j I c)ython" , "python" ) 

Otra option consistiria en encerrar los caracteres ' p ' , 1 j 1 y 1 c ' entre 
corchetes para formar una clase de caracteres, indicando que en esa po- 
sition puede colocarse cualquiera de los caracteres de la clase. 

re .match ( " [p jc]ython" , "python" ) 

<;Y si quisieramos comprobar si la cadena es "python®", "python 1 ", 
"python2", ... , "python9"? En lugar de tener que encerrar los 10 digitos 
dentro de los corchetes podemos utilizar el guion, que sirve para indi- 
car rangos. Por ejemplo a-d indicaria todas las letras minusculas de la 
' a ' a la 1 d ' ; 0-9 serian todos los numeros de 0 a 9 inclusive. 

re.match("python[0-9]" , "python0") 

Si quisieramos, por ejemplo, que el ultimo caracter fuera o un digito o 
una letra simplemente se escribirian dentro de los corchetes todos los 
criterios, uno detras de otro. 

re.match("python[0-9a-zA-Z]" , "pythonp") 

Es necesario advertir que dentro de las clases de caracteres los caracte- 
res especiales no necesitan ser escapados. Para comprobar si la cadena 
es "python . " o "python , ", entonces, escribiriamos: 

re.match("python[ . ,]", "python. ") 
y no 

re.match("python[\. , ]", "python. ") 

ya que en este ultimo caso estariamos comprobando si la cadena es 
"python . ", "python , " o "pythonV. 

Los conjuntos de caracteres tambien se pueden negar utilizando el 
simbolo ' A '. La expresion "python[^0-9a-z] ", por ejemplo, indicaria 
que nos interesan las cadenas que comiencen por "python" y tengan 
como ultimo caracter algo que no sea ni una letra minuscula ni un 
numero. 
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re .match( "python [A@-9a-z] " , "python+" ) 

El uso de [ 0 - 9 ] para referirse a un digito no es muy comun, ya que, al 
ser la comprobacion de que un caracter es un di'gito algo muy utilizado, 
existe una secuencia especial equivalente: ' \d ' . Existen otras secuen- 
cias disponibles que listamos a continuation: 

" \ d " : un di'gito. Equivale a [ 0 - 9 ] 

• " \D " : cualquier caracter que no sea un di'gito. Equivale a [ A 0 - 9 ] 

• "\w": cualquier caracter alfanumerico. Equivale a [a-zA-Z0-9_] 

• "\W": cualquier caracter no alfanumerico. Equivale a [ A a-zA- 
Z0-9_] 

• "\s": cualquier caracter en bianco. Equivale a [ \t\n\r\f\v] 

• " \S " : cualquier caracter que no sea un espacio en bianco. Equivale 
a [a \t\n\r\f\v] 

Veamos ahora como representar repeticiones de caracteres, dado que 
no seria de mucha utilidad tener que, por ejemplo, escribir una expre- 
sion regular con 30 caracteres ' \d ' para buscar numeros de 30 di'gitos. 
Para este menester tenemos los caracteres especiales +, * y ?, ademas de 
las Haves { } . 

El caracter + indica que lo que tenemos a la izquierda, sea un carac- 
ter como ' a ' , una clase como ' [ abc ] 1 o un subpatron como ( abc ) , 
puede encontrarse una o mas veces. Por ejemplo la expresion regular 
"python+" describiria las cadenas "python", "pythonn" y "pythonnn", 
pero no "pytho", ya que debe haber al menos una n. 

El caracter * es similar a +, pero en este caso lo que se situa a su iz- 
quierda puede encontrarse cero o mas veces. 

El caracter ? indica opcionalidad, es decir, lo que tenemos a la izquier- 
da puede o no aparecer (puede aparecer 0 o 1 veces). 

Finalmente las Haves sirven para indicar el numero de veces exacto que 
puede aparecer el caracter de la izquierda, o bien un rango de veces que 
puede aparecer. Por ejemplo {3} indicaria que tiene que aparecer exac- 
tamente 3 veces, {3,8} indicaria que tiene que aparecer de 3 a 8 veces, 
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{ , 8 } de 0 a 8 veces y { 3 , } tres veces o mas (las que sean). 

Otro elemento interesante en las expresiones regulares, para terminar, 
es la especificacion de las posiciones en que se tiene que encontrar la 
cadena, esa es la utilidad de A y $, que indican, respectivamente, que el 
elemento sobre el que actuan debe ir al principio de la cadena o al final 
de esta. 

La cadena "http : //mundogeek . net ", por ejemplo, se ajustaria a la 
expresion regular "^http", mientras que la cadena "El protocolo es 
http" no lo haria, ya que el http no se encuentra al principio de la 
cadena. 

Usando el modulo re 

Ya hemos visto por encima como se utiliza la funcion match del modu- 
lo re para comprobar si una cadena se ajusta a un determinado patron. 
El primer parametro de la funcion es la expresion regular, el segundo, 
la cadena a comprobar y existe un tercer parametro opcional que con- 
tiene distintos flags que se pueden utilizar para modificar el comporta- 
miento de las expresiones regulares. 

Algunos ejemplos de flags del modulo re son re . IGNORECASE, que hace 
que no se tenga en cuenta si las letras son mayusculas o minusculas o 
re .VERBOSE, que hace que se ignoren los espacios y los comentarios en 
la cadena que representa la expresion regular. 

El valor de retorno de la funcion sera None en caso de que la cadena no 
se ajuste al patron o un objeto de tipo MatchOb ject en caso contrario. 
Este objeto MatchObject cuenta con metodos start y end que devuel- 
ven la position en la que comienza y finaliza la subcadena reconocida y 
metodos group y groups que permiten acceder a los grupos que propi- 
ciaron el reconocimiento de la cadena. 

Al llamar al metodo group sin parametros se nos devuelve el grupo 0 
de la cadena reconocida. El grupo 0 es la subcadena reconocida por 
la expresion regular al completo, aunque no existan parentesis que 
delimiten el grupo. 
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»> mo = re.match("http://.+\net" , "http://mundogeek.net") 
»> print mo.groupO 
http : //mundogeek . net 

Podriamos crear grupos utilizando los parentesis, como aprendimos 
en la section anterior, obteniendo asi la parte de la cadena que nos 
interese. 

»> mo = re.match("http://( .+)\net" , "http://mundogeek.net") 

>» print mo.group(S) 

http: //mundogeek . net 

>» print mo.group( 1 ) 

mundogeek 

El metodo groups, por su parte, devuelve una lista con todos los gru- 
pos, exceptuando el grupo 0, que se omite. 

»> mo = re .match( "http : //( .+)\( . {3 } ) " , "http : //mundogeek . 
net") 

>» print mo.groups( ) 
( 'mundogeek ' , ' net ' ) 

La funcion search del modulo re funciona de forma similar a match; 
contamos con los mismos parametros y el mismo valor de retorno. 
La unica diferencia es que al utilizar match la cadena debe ajustarse al 
patron desde el primer caracter de la cadena, mientras que con search 
buscamos cualquier parte de la cadena que se ajuste al patron. Por esta 
razon el metodo start de un objeto MatchObject obtenido mediante la 
funcion match siempre devolvera 0, mientras que en el caso de search 
esto no tiene por que ser asi. 

Otra funcion de busqueda del modulo re es f indall. Este toma los 
mismos parametros que las dos funciones anteriores, pero devuelve una 
lista con las subcadenas que cumplieron el patron. 

Otra posibilidad, si no queremos todas las coincidencias, es utilizar 
f inditer, que devuelve un iterador con el que consultar uno a uno los 
distintos MatchObject. 

Las expresiones regulares no solo permiten realizar busquedas o 
comprobaciones, sino que, como comentamos anteriormente, tambien 
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tenemos fimciones disponibles para dividir la cadena o realizar reem- 
plazos. 

La funcion split sin ir mas lejos toma como parametros un patron, 
una cadena y un entero opcional indicando el numero maximo de 
elementos en los que queremos dividir la cadena, y utiliza el patron a 
modo de puntos de separation para la cadena, devolviendo una lista 
con las subcadenas. 

La funcion sub toma como parametros un patron a sustituir, una 
cadena que usar como reemplazo cada vez que encontremos el patron, 
la cadena sobre la que realizar las sustituciones, y un entero opcional 
indicando el numero maximo de sustituciones que queremos realizar. 

Al llamar a estos metodos lo que ocurre en realidad es que se crea un 
nuevo objeto de tipo RegexObject que representa la expresion regular,y 
se llama a metodos de este objeto que tienen los mismos nombres que 
las funciones del modulo. 

Si vamos a utilizar un mismo patron varias veces nos puede interesar 
crear un objeto de este tipo y llamar a sus metodos nosotros mismos; 
de esta forma evitamos que el interprete tenga que crear un nuevo 
objeto cada vez que usemos el patron y mejoraremos el rendimiento de 
la aplicacion. 

Para crear un objeto RegexObject se utiliza la funcion compile del 
modulo, al que se le pasa como parametro la cadena que representa el 
patron que queremos utilizar para nuestra expresion regular y, opcio- 
nalmente, una serie de flags de entre los que comentamos anterior- 
mente. 
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La comunicacion entre distintas entidades en una red se basa en 
Python en el clasico concepto de sockets. Los sockets son un concepto 
abstracto con el que se designa al punto final de una conexion. 

Los programas utilizan sockets para comunicarse con otros programas, 
que pueden estar situados en computadoras distintas. 

Un socket queda definido por la direction IP de la maquina, el puerto 
en el que escucha, y el protocolo que utiliza. 

Los tipos y funciones necesarios para trabajar con sockets se encuen- 
tran en Python en el modulo socket, como no podria ser de otra 
forma. 

Los sockets se clasifican en sockets de flujo (socket . SOCK_STREAM) o 
sockets de datagramas (socket .SOCK_DGRAM) dependiendo de si el ser- 
vicio utiliza TCP, que es orientado a conexion y fiable, o UDP, respec- 
tivamente. En este capi'tulo solo cubriremos los sockets de flujo, que 
cubren un 90% de las necesidades comunes. 

Los sockets tambien se pueden clasificar segun la familia. Tenemos 
sockets UNIX (socket . AFJJNIX) que se crearon antes de la conception 
de las redes y se basan en ficheros, sockets socket . AF_INET que son los 
que nos interesan, sockets socket .AF_INET6 para IPv6, etc. 

Para crear un socket se utiliza el constructor socket . socket ( ) que pue- 
de tomar como parametros opcionales la familia, el tipo y el protocolo. 
Por defecto se utiliza la familia AF_INET y el tipo S0CK_STREAM. 

Veremos durante el resto del capi'tulo como crear un par de programas 
cliente y servidor a modo de ejemplo. 
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Lo primero que tenemos que hacer es crear un objeto socket para el 
servidor 

socket_s = socket . socket( ) 

Tenemos ahora que indicar en que puerto se va a mantener a la escu- 
cha nuestro servidor utilizando el metodo bind. Para sockets IP, como 
es nuestro caso, el argumento de bind es una tupla que contiene el 
host y el puerto. El host se puede dejar vacio, indicando al metodo que 
puede utilizar cualquier nombre que este disponible. 

socket_s.bind( ("localhost" , 9999) ) 

Por ultimo utilizamos listen para hacer que el socket acepte conexio- 
nes entrantes y accept para comenzar a escuchar. El metodo listen 
requiere de un parametro que indica el numero de conexiones maximas 
que queremos aceptar; evidentemente, este valor debe ser al menos 1. 

El metodo accept se mantiene a la espera de conexiones entrantes, 
bloqueando la ejecucion hasta que llega un mensaje. 

Cuando llega un mensaje, accept desbloquea la ejecucion, devolviendo 
un objeto socket que representa la conexion del cliente y una tupla que 
contiene el host y puerto de dicha conexion. 

socket_s . listen( 10) 

socket_c, (host_c, puerto_c) = socket_s . accept ( ) 

Una vez que tenemos este objeto socket podemos comunicarnos con 
el cliente a traves suyo, mediante los metodos recv y send (o recvf rom 
y sendf rom en UDP) que permiten recibir o enviar mensajes respec- 
tivamente. El metodo send toma como parametros los datos a enviar, 
mientras que el metodo recv toma como parametro el numero maxi- 
mo de bytes a aceptar. 

recibido = socket_c . recv( 1024) 
print "Recibido: ", recibio 
socket _c.send( recibido) 
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Una vez que hemos terminado de trabajar con el socket, lo cerramos 
con el metodo close. 



Crear un cliente es aun mas sencillo. Solo tenemos que crear el objeto 
socket, utilizar el metodo connect para conectarnos al servidor y uti- 
lizar los metodos send y recv que vimos anteriormente. El argumento 
de connect es una tupla con host y puerto, exactamente igual que bind. 

socket_c = socket . socket( ) 

socket_c . connect ( ( " localhost " , 9999) ) 

socket_c . send( "hola" ) 



Veamos por ultimo un ejemplo completo. En este ejemplo el cliente 
manda al servidor cualquier mensaje que escriba el usuario y el servi- 
dor no hace mas que repetir el mensaje recibido. La ejecucion termina 
cuando el usuario escribe quit. 



Este seria el codigo del script servidor: 

import socket 

s = socket . socket ( ) 
s.bind(("localhost", 9999)) 
s . listen( 1 ) 

sc, addr = s.accept() 

while True: 

recibido = sc . recv( 1024) 
if recibido == "quit" : 
break 

print "Recibido:", recibido 
sc.send(recibido) 

print "adios" 

sc .close( ) 
s.close( ) 



Y a continuation tenemos el del script cliente: 

import socket 

s = socket . socket ( ) 
s.connect(("localhost" , 9999)) 
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while True: 

mensaje = raw_input( "> ") 
s . send(mensa je) 
mensaje == "quit" : 
break 

print "adios" 

s . close( ) 
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Existen dos modulos principales para leer datos de URLs en Python: 
urllib y urllib2. En esta lection aprenderemos a utilizar urllib2 
ya que es mucho mas completo, aunque urllib tiene funcionalidades 
propias que no se pueden encontrar en ur 11 ib2, por lo que tambien lo 
tocaremos de pasada. 

urllib2 puede leer datos de una URL usando varios protocolos como 
HTTP, HTTPS, FTP, o Gopher. 

Se utiliza una funcion urlopen para crear un objeto parecido a un 
fichero con el que leer de la URL. Este objeto cuenta con metodos 
como read, readline, readlines y close, los cuales funcionan exac- 
tamente igual que en los objetos file, aunque en realidad estamos 
trabajando con un wrapper que nos abstrae de un socket que se utiliza 
por debajo. 

El metodo read, como recordareis, sirve para leer el "archivo" completo 
o el numero de bytes especificado como parametro, readline para leer 
una linea, y readlines para leer todas las tineas y devolver una lista con 
ellas. 

Tambien contamos con un par de metodos geturl, para obtener la 
URL de la que estamos leyendo (que puede ser util para comprobar si 
ha habido una redirection) e info que nos devuelve un objeto con las 
cabeceras de respuesta del servidor (a las que tambien se puede acceder 
mediante el atributo headers). 

import urllib2 
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try: 

f = urllib2.urlopen("http://www. python. org") 

print f.read() 

f .close( ) 
except HTTPError, e: 

print "Ocurrio un error" 

print e.code 
except URLError, e: 

print "Ocurrio un error" 

print e. reason 

Al trabajar con ur 11 ib2 nos podemos encontrar, como vemos, con 
errores de tipo URLError. Si trabajamos con HTTP podemos encon- 
trarnos tambien con errores de la subclase de URLError HTTPError, que 
se lanzan cuando el servidor devuelve un codigo de error HTTP, como 
el error 404 cuando no se encuentra el recurso. Tambien podriamos 
encontrarnos con errores lanzados por la libreria que urllib2 utiliza 
por debajo para las transferencias HTTP: httplib; o con excepciones 
lanzadas por el propio modulo socket. 

La funcion urlopen cuenta con un parametro opcional data con el que 
poder enviar information a direcciones HTTP (y solo HTTP) usando 
POST (los parametros se envian en la propia petition), por ejemplo 
para responder a un formulario. Este parametro es una cadena codifi- 
cada adecuadamente, siguiendo el formato utilizado en las URLs: 

' password=contrase%A4a&usuar io=manuel ' 

Lo mas sencillo para codificar la cadena es utilizar el metodo url en- 
code de urllib, que acepta un diccionario o una lista de tuplas (clave, 
valor) y genera la cadena codificada correspondiente: 



import urllib, urllib2 

params = urllib. urlencode( {"usuario" : "manuel", 

"password": "contrasena" } ) 
f = urllib2. urlopen( "http: //ejemplo. com/login" , params) 

Si lo unico que queremos hacer es descargar el contenido de una URL 
a un archivo local, podemos utilizar la funcion urlretrieve de urllib 
en lugar de leer de un objeto creado con urlopen y escribir los datos 
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lei'dos. 

La funcion urlretrieve toma como parametros la URL a descar- 
gar y, opcionalmente, un parametro filename con la ruta local en la 
que guardar el archivo, un parametro data similar al de ur lopen y un 
parametro reporthook con una funcion que utilizar para informar del 
progreso. 

A exception de las ocasiones en las que se utiliza el parametro data 
las conexiones siempre se realizan utilizando GET (los parametros se 
envian en la URL). Para enviar datos usando GET basta con concate- 
nar la cadena resultante de urlencode con la URL a la que nos vamos a 
conectar mediante el simbolo ?. 

params = urUib.urlencode( {"usuario" : "manuel", 

"password": "contrasena" } ) 

f = urUib2.urlopen("http://ejemplo. com/login" + 
"?" + params) 

En urllib tambien se utiliza una funcion urlopen para crear nuestros 
pseudo-archivos, pero a diferencia de la version de urllib, la funcion 
urlopen de urllib2 tambien puede tomar como parametro un objeto 
Request, en lugar de la URL y los datos a enviar. 

La clase Request define objetos que encapsulan toda la information 
relativa a una petition. A traves de este objeto podemos realizar peti- 
ciones mas complejas, anadiendo nuestras propias cabeceras, como el 
User-Agent. 

El constructor mas sencillo para el objeto Request no toma mas que 
una cadena indicando la URL a la que conectarse, por lo que utilizar 
este objeto como parametro de urlopen seria equivalente a utilizar una 
cadena con la URL directamente. 

Sin embargo el constructor de Request tambien tiene como parame- 
tros opcionales una cadena data para mandar datos por POST y un 
diccionario headers con las cabeceras (ademas de un par de campos 
origin_req_host y unverif iable, que quedan fuera del proposito del 
capi'tulo por ser de raro uso). 
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Veamos como anadir nuestras propias cabeceras utilizando como 
ejemplo la cabecera User- Agent. El User- Agent es una cabecera que 
sirve para identificar el navegador y sistema operativo que estamos 
utilizando para conectarnos a esa URL. Por defecto urllib2 se identi- 
fica como "Python-urllib/2.5"; si quisieramos identificarnos como un 
Linux corriendo Konqueror por ejemplo, usariamos un codigo similar 
al siguiente: 

ua = "Mozilla/5.0 (compatible; Konqueror/3 . 5 . 8 ; Linux)" 
h = { "User-Agent" : ua} 

r = urllib2. Request( "http: //www. python. org" , headers=h) 
f = urllib2.urlopen(r) 
print f.read() 

Para personalizar la forma en que trabaja urllib2 podemos instalar un 
grupo de manejadores {handlers) agrupados en un objeto de la clase 
OpenerDirector (opener o abridor), que sera el que se utilice a partir de 
ese momento al llamar a urlopen. 

Para construir un opener se utiliza la funcion bui IcLopener a la que se 
le pasa los manejadores que formaran parte del opener. El opener se 
encargara de encadenar la ejecucion de los distintos manejadores en el 
orden dado. Tambien se puede usar el constructor de OpenerDirector, 
y anadir los manejadores usando su metodo adcLhandler. 

Para instalar el opener una vez creado se utiliza la funcion ins- 
tall_opener, que toma como parametro el opener a instalar. Tambien 
se podria, si solo queremos abrir la URL con ese opener una sola vez, 
utilizar el metodo open del opener. 

urllib2 cuenta con handlers que se encargan de manejar los esquemas 
disponibles (HTTP, HTTPS, FTP), manejar la autenticacion, manejar 
las redirecciones, etc. 

Para anadir autenticacion tendriamos que instalar un opener que in- 
cluyera como manejador HTTPBasicAuthHandler, ProxyBasicAuthHan- 
dler, HTTPDigestAuthHandler y/o ProxyDigestAuthHandler. 

Para utilizar autenticacion HTTP basica, por ejemplo, usariamos 
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HTTPBasicAuthHandler: 

aut_h = urUib2.HTTPBasicAuthHandler() 

aut_h . add_password( "realm" , "host", "usuario", "password") 

opener = urUib2.build_opener(aut_h) 
urllib2. install_opener (opener ) 

f = urllib2.urlopen("http://www. python. org") 

Si quisieramos especificar un proxy en el codigo tendriamos que 
utilizar un opener que contuviera el manejador ProxyHand ler. El 
manejador por defecto incluye una instacia de ProxyHandler construi- 
do llamando al inicializador sin parametros, con lo que se lee la lista 
de proxies a utilizar de la variable de entorno adecuada. Sin embargo 
tambien podemos construir un ProxyHandler pasando como parame- 
tro al inicializador un diccionario cuyas claves son los protocolos y los 
valores, la URL del proxy a utilizar para dicho protocolo. 

proxy_h = urllib2 . ProxyHandler( { "http" : "http: //miproxy . 
net: 123"}) 

opener = urllib2.build_opener(proxy_h) 
urllib2. install_opener (opener ) 

f = urllib2.urlopen("http://www. python. org") 

Para que se guarden las cookies que manda HTTP utilizamos el ma- 
nejador HTTPCookieProcessor. 

cookie_h = urllib2 .HTTPCookieProcessor( ) 

opener = urllib2.build_opener(cookie_h) 
urllib2. install_opener (opener ) 

f = urllib2.urlopen("http://www. python. org") 

Si queremos acceder a estas cookies o poder mandar nuestras propias 
cookies, podemos pasarle como parametro al inicializador de HTTPCoo- 
kieProcessor un objeto de tipo CookieJar del modulo cookielib. 

Para leer las cookies mandadas basta crear un objeto iterable a partir 
del CookieJar (tambien podriamos buscar las cabeceras correspondien- 
tes, pero este sistema es mas claro y sencillo): 
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import urllib2, cookielib 

cookie_j = cookielib. CookieJar() 

cookie_h = urllib2 .HTTPCookieProcessor(cookie_j ) 

opener = urUib2.build_opener(cookie_h) 
opener .open ( "http://www.python.org" ) 

for num, cookie in enumerate(cookie_j) : 
print num, cookie. name 
print cookie. value 
print 

En el improbable caso de que necesitaramos anadir una cookie an- 
tes de realizar la conexion, en lugar de conectarnos para que el sitio 
la mande, podriamos utilizar el metodo set_cookie de CookieJar, al 
que le pasamos un objeto de tipo Cookie. El constructor de Cookie, no 
obstante, es bastante complicado. 
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iQue son los procesos y los 
threads? 

Las computadoras serian mucho menos utiles si no pudieramos hacer 
mas de una cosa a la vez. Si no pudieramos, por ejemplo, escuchar 
musica en nuestro reproductor de audio favorito mientras leemos un 
tutorial de Python en Mundo Geek. 

Pero, ^como se conseguia esto en computadoras antiguas con un solo 
nucleo / una sola CPU? Lo que ocurria, y lo que ocurre ahora, es que 
en realidad no estamos ejecutando varios procesos a la vez (se llama 
proceso a un programa en ejecucion), sino que los procesos se van tur- 
nando y, dada la velocidad a la que ejecutan las instrucciones, nosotros 
tenemos la impresion de que las tareas se ejecutan de forma paralela 
como si tuvieramos multitarea real. 

Cada vez que un proceso distinto pasa a ejecutarse es necesario reali- 
zar lo que se llama un cambio de contexto, durante el cual se salva el 
estado del programa que se estaba ejecutando a memoria y se carga el 
estado del programa que va a entrar a ejecutarse. 

En Python podemos crear nuevos procesos mediante la funcion os . 
fork , que ejecuta la llamada al sistema fork, o mediante otras funcio- 
nes mas avanzadas como popen2 . popen2, de forma que nuestro progra- 
ma pueda realizar varias tareas de forma paralela. 

Sin embargo el cambio de contexto puede ser relativamente lento, y 
los recursos necesarios para mantener el estado demasiados, por lo que 
a menudo es mucho mas eficaz utilizar lo que se conoce como threads, 
hilos de ejecucion, o procesos ligeros. 
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Los threads son un concepto similar a los procesos: tambien se trata de 
codigo en ejecucion. Sin embargo los threads se ejecutan dentro de un 
proceso, y los threads del proceso comparten recursos entre si, como la 
memoria, por ejemplo. 

El sistema operativo necesita menos recursos para crear y gestionar los 
threads, y al compartir recursos, el cambio de contexto es mas rapido. 
Ademas, dado que los threads comparten el mismo espacio de me- 
moria global, es sencillo compartir information entre ellos: cualquier 
variable global que tengamos en nuestro programa es vista por todos 
los threads. 

El GIL 

La ejecucion de los threads en Python esta controlada por el GIL 
(Global Interpreter Lock) de forma que solo un thread puede ejecutar- 
se a la vez, independientemente del numero de procesadores con el que 
cuente la maquina. Esto posibilita que el escribir extensiones en C para 
Python sea mucho mas sencillo, pero tiene la desventaja de limitar mu- 
cho el rendimiento, por lo que a pesar de todo, en Python, en ocasiones 
nos puede interesar mas utilizar procesos que threads, que no sufren de 
esta limitation. 

Cada cierto numero de instrucciones de bytecode la maquina virtual 
para la ejecucion del thread y elige otro de entre los que estaban espe- 
rando. 

Por defecto el cambio de thread se realiza cada 10 instrucciones de 
bytecode, aunque se puede modificar mediante la funcion sys . set - 
checkinterval. Tambien se cambia de thread cuando el hilo se pone a 
dormir con time .sleep o cuando comienza una operacion de entrada/ 
salida, las cuales pueden tardar mucho en finalizar, y por lo tanto, de no 
realizar el cambio, tendriamos a la CPU demasiado tiempo sin trabajar 
esperando a que la operacion de E/S terminara. 

Para minimizar un poco el efecto del GIL en el rendimiento de nues- 
tra aplicacion es conveniente llamar al interprete con el flag -0, lo que 
hara que se genere un bytecode optimizado con menos instrucciones, y, 
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por lo tanto, menos cambios de contexto. Tambien podemos plantear- 
nos el utilizar procesos en lugar de threads, como ya comentamos, uti- 
lizando por ejemplo el modulo processing; escribir el codigo en el que 
el rendimiento sea critico en una extension en C o utilizar IronPython 
o Jython, que carecen de GIL. 

Threads en Python 

El trabajo con threads se lleva a cabo en Python mediante el modulo 
thread. Este modulo es optional y dependiente de la plataforma, y 
puede ser necesario, aunque no es comun, recompilar el interprete para 
anadir el soporte de threads. 

Ademas de thread, tambien contamos con el modulo threading que se 
apoya en el primero para proporcionarnos una API de mas alto nivel, 
mas completa, y orientada a objetos. El modulo threading se basa 
ligeramente en el modelo de threads de Java. 

El modulo threading contiene una clase Thread que debemos ex- 
tender para crear nuestros propios hilos de ejecucion. El metodo run 
contendra el codigo que queremos que ejecute el thread. Si queremos 
especificar nuestro propio constructor, este debera llamar a threading . 
Thread. init (self) para inicializar el objeto correctamente. 

import threading 

class MiThread( threading .Thread) : 

def init (self , num) : 

threading. Thread. init (self) 

self. num = num 

def run(self ) : 

print "Soy el hilo", self. num 

Para que el thread comience a ejecutar su codigo basta con crear una 
instancia de la clase que acabamos de definir y llamar a su metodo 
start. El codigo del hilo principal y el del que acabamos de crear se 
ejecutaran de forma concurrente. 

print "Soy el hilo principal" 
for i in range(0, 10) : 
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t = MiThread(i) 
t.start() 
t. join() 

El metodo join se utiliza para que el hilo que ejecuta la llamada se 
bloquee hasta que finalice el thread sobre el que se llama. En este caso 
se utiliza para que el hilo principal no termine su ejecucion antes que 
los hijos, lo cual podria resultar en algunas plataformas en la termina- 
tion de los hijos antes de finalizar su ejecucion. El metodo join puede 
tomar como parametro un numero en coma flotante indicando el 
numero maximo de segundos a esperar. 

Si se intenta llamar al metodo start para una instancia que ya se esta 
ejecutando, obtendremos una exception. 

La forma recomendada de crear nuevos hilos de ejecucion consiste en 
extender la clase Thread, como hemos visto, aunque tambien es posible 
crear una instancia de Thread directamente, e indicar como parametros 
del constructor una clase ejecutable (una clase con el metodo especial 

call ) o una funcion a ejecutar, y los argumentos en una tupla 

(parametro args) o un diccionario (parametro kwargs). 

import threading 

def imprime(num) : 

print "Soy el hilo", num 

print "Soy el hilo principal" 

for i in range(0, 10) : 

t = threading. Thread(target=imprime, args=(i, )) 
t.start() 

Ademas de los parametros target, args y kwargs tambien podemos 
pasar al constructor un parametro de tipo cadena name con el nom- 
bre que queremos que tome el thread (el thread tendra un nombre 
predeterminado aunque no lo especifiquemos); un parametro de tipo 
booleano verbose para indicar al modulo que imprima mensajes sobre 
el estado de los threads para la depuration y un parametro group, que 
por ahora no admite ningun valor pero que en el future se utilizara 
para crear grupos de threads y poder trabajar a nivel de grupos. 
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Para comprobar si un thread sigue ejecutandose, se puede utilizar el 
metodo isAlive. Tambien podemos asignar un nombre al hilo y con- 
sultar su nombre con los metodos setName y getName, respectivamente. 

Mediante la funcion threading. enumerate obtendremos una lista de 
los objetos Thread que se estan ejecutando, incluyendo el hilo principal 
(podemos comparar el objeto Thread con la variable main_thread para 
comprobar si se trata del hilo principal) y con threading . activeCount 
podemos consultar el numero de threads ejecutandose. 

Los objetos Thread tambien cuentan con un metodo setDaemon que 
toma un valor booleano indicando si se trata de un demonio. La utili- 
dad de esto es que si solo quedan threads de tipo demonio ejecutando- 
se, la aplicacion terminara automaticamente, terminando estos threads 
de forma segura. 

Por ultimo tenemos en el modulo threading una clase Timer que he- 
reda de Thread y cuya utilidad es la de ejecutar el codigo de su metodo 
run despues de un periodo de tiempo indicado como parametro en 
su constructor. Tambien incluye un metodo cancel mediante el que 
cancelar la ejecucion antes de que termine el periodo de espera. 



Sincronizacion 

Uno de los mayores problemas a los que tenemos que enfrentarnos al 
utilizar threads es la necesidad de sincronizar el acceso a ciertos recur- 
sos por parte de los threads. Entre los mecanismos de sincronizacion 
que tenemos disponibles en el modulo threading se encuentran los 
locks, locks reentrantes, semaforos, condiciones y eventos. 



Los locks, tambien llamados mutex (de mutual exclusion), cierres 
de exclusion mutua, cierres o candados, son objetos con dos estados 
posibles: adquirido o libre. Cuando un thread adquiere el candado, los 
demas threads que lleguen a ese punto posteriormente y pidan adqui- 
rirlo se bloquearan hasta que el thread que lo ha adquirido libere el 
candado, momento en el cual podra entrar otro thread. 

El candado se representa mediante la clase Lock. Para adquirir el 
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candado se utiliza el metodo acquire del objeto, al que se le puede 
pasar un booleano para indicar si queremos esperar a que se libere 
(True) o no (False). Si indicamos que no queremos esperar, el metodo 
devolvera True o False dependiendo de si se adquirio o no el candado, 
respectivamente. Por defecto, si no se indica nada, el hilo se bloquea 
indefmidamente. 

Para liberar el candado una vez hemos terminado de ejecutar el bloque 
de codigo en el que pudiera producirse un problema de concurrencia, 
se utiliza el metodo release. 

lista = [] 

lock = threading. Lock() 

def anyadir (ob j ) : 
lock . acquire( ) 
lista . append(ob j ) 
lock . release( ) 

def obtener ( ) : 

lock . acquire( ) 
obj = lista. pop() 
lock . release( ) 
return obj 

La clase RLock funciona de forma similar a Lock, pero en este caso el 
candado puede ser adquirido por el mismo thread varias veces, y no 
quedara liberado hasta que el thread llame a release tantas veces como 
llamo a acquire. Como en Lock,y como en todas las primitivas de sin- 
cronizacion que veremos a continuation, es posible indicar a acquire si 
queremos que se bloquee o no. 

Los semaforos son otra clase de candados. La clase correspondiente, 
Semaphore, tambien cuenta con metodos acquire y release, pero se di- 
ferencia de un Lock normal en que el constructor de Semaphore puede 
tomar como parametro opcional un entero value indicando el numero 
maximo de threads que pueden acceder a la vez a la section de codigo 
critico. Si no se indica nada permite el acceso a un solo thread. 

Cuando un thread llama a acquire, la variable que indica el numero 
de threads que pueden adquirir el semaforo disminuye en 1, porque 
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hemos permitido entrar en la section de codigo critico a un hilo mas. 
Cuando un hilo llama a release, la variable aumenta en 1. 

No es hasta que esta variable del semaforo es 0, que llamar a acquire 
producira un bloqueo en el thread que realizo la petition, a la espera de 
que algun otro thread llame a release para liberar su plaza. 

Es importante destacar que el valor inicial de la variable tal como lo 
pasamos en el constructor, no es un limite maximo, sino que multiples 
llamadas a release pueden hacer que el valor de la variable sea mayor 
que su valor original. Si no es esto lo que queremos, podemos utilizar 
la clase BoundedSemaphore en cuyo caso, ahora si, se consideraria un 
error llamar a release demasiadas veces, y se lanzaria una exception de 
tipo ValueError de superarse el valor inicial. 

Podriamos utilizar los semaforos, por ejemplo, en un pequeno pro- 
grama en el que multiples threads descargaran datos de una URL, de 
forma que pudieramos limitar el numero de conexiones a realizar al 
sitio web para no bombardear el sitio con cientos de peticiones concu- 
rrentes. 

semaforo = threading . Semaphore(4) 

def descargar(url) : 
semaforo . acquire( ) 
urllib. urlretrieve(url) 
semaforo . release( ) 

Las condiciones (clase Condition) son de utilidad para hacer que los 
threads solo puedan entrar en la section critica de darse una cierta 
condition o evento. Para esto utilizan un Lock pasado como parametro, 
o crean un objeto RLock automaticamente si no se pasa ningun para- 
metro al constructor. 

Son especialmente adecuadas para el clasico problema de productor- 
consumidor. La clase cuenta con metodos acquire y release, que 11a- 
maran a los metodos correspondientes del candado asociado. Tambien 
tenemos metodos wait, notify y notifyAll. 

El metodo wait debe llamarse despues de haber adquirido el candado 
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con acquire. Este metodo libera el candado y bloquea al thread hasta 
que una llamada a notify o notifyAU en otro thread le indican que se 
ha cumplido la condition por la que esperaba. El thread que informa a 
los demas de que se ha producido la condition, tambien debe llamar a 
acquire antes de llamar a notify o notifyAU. 

Al llamar a notify, se informa del evento a un solo thread, y por tanto 
se despierta un solo thread. Al llamar a notifyAU se despiertan todos 
los threads que esperaban a la condition. 

Tanto el thread que notifica como los que son notificados tienen que 
terminar liberando el lock con release. 

lista = [] 

cond = threading. Condition() 

def consumir( ) : 
cond . acquire( ) 
cond.wait( ) 
obj = lista. pop() 
cond . release( ) 
return obj 

def producir(ob j ) : 
cond . acquire( ) 
lista. append(obj) 
cond . notify( ) 
cond . release( ) 

Los eventos, implementados mediante al clase Event, son un wra- 
pper por encima de Condition y sirven principalmente para coordinar 
threads mediante senales que indican que se ha producido un evento. 
Los eventos nos abstraen del hecho de que estemos utilizando un Lock 
por debajo, por lo que carecen de metodos acquire y release. 

El thread que debe esperar el evento llama al metodo wa i t y se blo- 
quea, opcionalmente pasando como parametro un numero en coma 
flotante indicando el numero maximo de segundos a esperar. Otro 
hilo, cuando ocurre el evento, manda la serial a los threads bloqueados 
a la espera de dicho evento utilizando el metodo set. Los threads que 
estaban esperando se desbloquean una vez recibida la serial. El flag que 
determina si se ha producido el evento se puede volver a establecer a 
falso usando clear. 
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Como vemos los eventos son muy similares a las condiciones, a excep- 
tion de que se desbloquean todos los threads que esperaban el evento y 
que no tenemos que llamar a acquire y release. 

import threading, time 

class MiThread( threading .Thread) : 

def init (self, evento): 

threading. Thread. init (self) 

self. evento = evento 

def run(self): 

print self .getName( ) , "esperando al evento" 
self . evento .wait ( ) 

print self . getName( ) , "termina la espera" 

evento = threading. Event() 
tl = MiThread(evento) 
tl.start() 

t2 = MiThread(evento) 
t2.start() 

# Esperamos un poco 
time.sleep(5) 
evento . set ( ) 



Por ultimo, un pequeno extra. Si sois usuarios de Java sin duda estareis 
echando en falta una palabra clave syncronized para hacer que solo 
un thread pueda acceder al metodo sobre el que se utiliza a la vez. Una 
construction comun es el uso de un decorador para implementar esta 
funcionalidad usando un Lock. Seria algo asf: 

def synchronized( lock) : 
def dec(f): 

def f unc_dec(*args , **kwargs): 
lock . acquired) 
try: 

return f(*args, **kwargs) 
finally: 

lock . release( ) 
return func_dec 
return dec 

class MyThread( threading .Thread) : 
@synchronized(mi_lock) 
def run(self): 

print "metodo sincronizado" 
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Datos globales independientes 

Como ya hemos comentado los threads comparten las variables 
globales. Sin embargo pueden existir situaciones en las que queramos 
utilizar variables globales pero que estas variables se comporten como 
si fueran locales a un solo thread. Es decir, que cada uno de los threads 
tengan valores distintos independientes, y que los cambios de un deter- 
minado thread sobre el valor no se vean reflejados en las copias de los 
demas threads. 



Para lograr este comportamiento se puede utilizar la clase threading, 
local, que crea un almacen de datos locales. Primero debemos crear 
una instancia de la clase, o de una subclase, para despues almacenar y 
obtener los valores a traves de parametros de la clase. 

datos_locales = threading. local( ) 
datos_locales .mi_var = "hola" 
print datos_locales.mi_var 

Fijemonos en el siguiente codigo, por ejemplo. Para el hilo principal el 
objeto local tiene un atributo var, y por lo tanto el print imprime su 
valor sin problemas. Sin embargo para el hilo t ese atributo no existe, y 
por lo tanto lanza una exception. 

local = threading. local ( ) 

def f(): 

print local. var 

local .var = "hola" 

t = threading. Thread(target=f) 

print local. var 

t.start() 

t. join() 



Compartir informacion 

Para compartir informacion entre los threads de forma sencilla po- 
demos utilizar la clase Queue .Queue, que implementa una cola (una 
estructura de datos de tipo FIFO) con soporte multihilo. Esta clase 
utiliza las primitivas de threading para ahorrarnos tener que sincroni- 
zar el acceso a los datos nosotros mismos. 
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El constructor de Queue toma un parametro opcional indicando el 
tamano maximo de la cola. Si no se indica ningun valor no hay limite 
de tamano. 



Para anadir un elemento a la cola se utiliza el metodo put( item); para 
obtener el siguiente elemento, get( ). Ambos metodos tienen un para- 
metro booleano opcional block que indica si queremos que se espere 
hasta que haya algun elemento en la cola para poder devolverlo o hasta 
que la cola deje de estar llena para poder introducirlo. 

Tambien existe un parametro opcional timeout que indica, en segun- 
dos, el tiempo maximo a esperar. Si el timeout acaba sin poder haber 
realizado la operacion debido a que la cola estaba llena o vacia, o bien 
si block era False, se lanzara una exception de tipo Queue .Full o 
Queue . Empty, respectivamente. 

Con qsize obtenemos el tamano de la cola y con empty ( ) y f u 1 1 ( ) 
podemos comprobar si esta vacia o llena. 

q = Queue .Queue( ) 

class MiThread( threading .Thread) : 

def init (self , q) : 

self .q = q 

threading .Thread . init (self) 

def run(self): 
while True: 
try: 

obj = q.get(False) 
except Queue. Empty: 

print "Fin" 

break 
print obj 

for i in range( 10) : 
q.put(i) 

t = MiThread(q) 

t.start() 

t. join() 
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Algunas veces tenemos la necesidad de guardar un objeto a disco para 
poder recuperarlo mas tarde, o puede que nos sea necesario mandar un 
objeto a traves de la red, a otro programa en Python ejecutandose en 
otra maquina. 

Al proceso de transformar el estado de un objeto en un formato que se 
pueda almacenar, recuperar y transportar se le conoce con el nombre de 
serialization o marshalling. 

En Python tenemos varios modulos que nos facilitan esta tarea, como 
marshal, pickle, cPickley shelve. 

El modulo marshal es el mas basico y el mas primitivo de los tres, y 
es que, de hecho, su proposito principal y su razon de ser no es el de 
serializar objetos, sino trabajar con bytecode Python (archivos .pyc). 

marshal solo permite serializar objetos simples (la mayoria de los tipos 
incluidos por defecto en Python), y no proporciona ningun tipo de 
mecanismo de seguridad ni comprobaciones frente a datos corruptos o 
mal formateados. Es mas, el formato utilizado para guardar el bytecode 
(y por tanto el formato utilizado para guardar los objetos con marshal) 
puede cambiar entre versiones, por lo que no es adecuado para almace- 
nar datos de larga duration. 

pickle, por su parte, permite serializar casi cualquier objeto (objetos de 
tipos definidos por el usuario, colecciones que contienen colecciones, 
etc) y cuenta con algunos mecanismos de seguridad basicos. Sin em- 
bargo, al ser mas complejo que marshal, y, sobre todo, al estar escrito en 
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Python en lugar de en C, como marshal, tambien es mucho mas lento. 

La solution, si la velocidad de la serialization es importante para nues- 
tra aplicacion, es utilizar cPickle, que no es mas que es una implemen- 
tation en C de pickle. cPickle es hasta 1000 veces mas rapido que 
p i c k 1 e , y practicamente igual de rapido quemarshal. 

Si intentamos importar cPickleyse produce un error por algun moti- 
vo, se lanzara una exception de tipo ImportError. Para utilizar cPickle 
si esta disponible ypickleen caso contrario, podriamos usar un codigo 
similar al siguiente: 

try: 

import cPickle as pickle 
except ImportError: 
import pickle 

as en un import sirve para importar el elemento seleccionado utilizan- 
do otro nombre indicado, en lugar de su nombre. 

La forma mas sencilla de serializar un objeto usando pickle es me- 
diante una llamada a la funcion dump pasando como argumento el 
objeto a serializar y un objeto archivo en el que guardarlo (o cualquier 
otro tipo de objeto similar a un archivo, siempre que ofrezca metodos 
read, realine y write). 

try: 

import cPickle as pickle 
except ImportError: 
import pickle 

fichero = file("datos.dat", "w") 
animales = ["piton", "mono", "camello"] 

pickle. dump(animales, fichero) 

fichero. close( ) 

La funcion dump tambien tiene un parametro opcional protocol que 
indica el protocolo a utilizar al guardar. Por defecto su valor es 0, que 
utiliza formato texto y es el menos eficiente. El protocolo 1 es mas 
eficiente que el 0, pero menos que el 2.Tanto el protocolo 1 como el 2 
utilizan un formato binario para guardar los datos. 
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try: 

import cPickle as pickle 
except ImportError : 
import pickle 

fichero = f ile( "datos .dat" , "w") 
animales = ["piton", "mono", "camello"] 

pickle. dump(animales, fichero, 2) 

fichero. close( ) 

Para volver a cargar un objeto serializado se utiliza la funcion load, a la 
que se le pasa el archivo en el que se guardo. 

try: 

import cPickle as pickle 
except ImportError: 
import pickle 

fichero = file( "datos .dat" , "w") 
animales = ["piton", "mono", "camello"] 

pickle. dump(animales, fichero) 

fichero. close( ) 

fichero = file( "datos .dat" ) 

animales2 = pickle. load(fichero) 
print animales2 

Supongamos ahora que queremos almacenar un par de listas en un fi- 
chero. Esto seria tan sencillo como llamar una vez a dump por cada lista, 
y llamar despues una vez a load por cada lista. 

fichero = file( "datos .dat" , "w") 
animales = ["piton", "mono", "camello"] 
lenguajes = ["python", "mono", "perl"] 

pickle. dump(animales, fichero) 
pickle. dump( lenguajes , fichero) 

fichero = file( "datos .dat" ) 

animales2 = pickle. load(fichero) 
lenguajes2 = pickle. load(fichero) 
print animales2 
print lenguajes2 
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Pero, <;y si hubieramos guardado 30 objetos y quisieramos acceder al 
ultimo de ellos? ±o si no recordaramos en que position lo habi'amos 
guardado? El modulo shelve extiende pickle / cPickle para propor- 
cionar una forma de realizar la serialization mas clara y sencilla, en la 
que podemos acceder a la version serializada de un objeto mediante 
una cadena asociada, a traves de una estructura parecida a un dicciona- 
rio. 

La unica funcion que necesitamos conocer del modulo shelve es open, 
que cuenta con un parametro filename mediante el que indicar la ruta 
a un archivo en el que guardar los objetos (en realidad se puede crear 
mas de un archivo, con nombres basados en filename, pero esto es 
transparente al usuario). 

La funcion open tambien cuenta con un parametro opcional protocol, 
con el que especificar el protocolo que queremos que utilice pickle por 
debajo. 

Como resultado de la llamada a open obtenemos un objeto Shelf, con 
el que podemos trabajar como si de un diccionario normal se tratase (a 
exception de que las claves solo pueden ser cadenas) para almacenar y 
recuperar nuestros objetos. 

Como un diccionario cualquiera la clase Shelf cuenta con metodos 
get, has_key, items, keys, values, ... 

Una vez hayamos terminado de trabajar con el objeto Shelf, lo cerrare- 
mos utilizando el metodo close. 

import shelve 

animales = ["piton", "mono", "camello"] 
lenguajes = ["python", "mono", "perl"] 

shelf = shelve. open("datos.dat") 
shelf [ "primera" ] = animales 
shelf [ "segunda" ] = lenguajes 

print shelf [ "segunda" ] 

shelf . close( ) 
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Existen problemas para los que guardar nuestros datos en ficheros de 
texto piano, en archivos XML, o mediante serialization con pickle o 
shelve pueden ser soluciones poco convenientes. En ocasiones no que- 
da mas remedio que recurrir a las bases de datos, ya sea por cuestiones 
de escalabilidad, de interoperabilidad, de coherencia, de seguridad, de 
confidencialidad, etc. 

A lo largo de este capitulo aprenderemos a trabajar con bases de 
datos en Python. Sin embargo se asumen una serie de conocimientos 
basicos, como puede ser el manejo elemental de SQL. Si este no es el 
caso, existen miles de recursos a disposition del lector en Internet para 
introducirse en el manejo de bases de datos. 

DB API 

Existen cientos de bases de datos en el mercado, tanto comerciales 
como gratuitas. Tambien existen decenas de modulos distintos para 
trabajar con dichas bases de datos en Python, lo que significa decenas 
de APIs distintas por aprender. 

En Python, como en otros lenguajes como Java con JDBC, existe una 
propuesta de API estandar para el manejo de bases de datos, de forma 
que el codigo sea practicamente igual independientemente de la base 
de datos que estemos utilizando por debajo. Esta especificacion recibe 
el nombre de Python Database API o DB-API y se recoge en el PEP 
249 (http://www.python.org/dev/peps/pep-0249/). 

DB-API se encuentra en estos momentos en su version 2.0, y existen 
implementaciones para las bases de datos relacionales mas conocidas, 
asi como para algunas bases de datos no relacionales. 
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A lo largo de este capi'tulo utilizaremos la base de datos SQLite para 
los ejemplos, ya que no se necesita instalar y ejecutar un proceso ser- 
vidor independiente con el que se comunique el programa, sino que se 
trata de una pequena libreria en C que se integra con la aplicacion y 
que viene incluida con Python por defecto desde la version 2.5. Desde 
la misma version Python tambien incorpora un modulo compatible 
con esta base de datos que sigue la especificacion de DB API 2.0: 
sqlite3, por lo que no necesitaremos ningun tipo de configuration 
extra. 



Nada impide al lector, no obstante, instalar y utilizar cualquier otra 
base de datos, como MySQL, con la cual podemos trabajar a traves 
del driver compatible con DB API 2.0 MySQLdb (http://mysql-python. 
sourceforge.net/). 

Variables globales 

Antes de comenzar a trabajar con sqlite3, vamos a consultar algunos 
datos interesantes sobre el modulo. Todos los drivers compatibles con 
DB-API 2.0 deben tener 3 variables globales que los describen. A 
saber: 



api level: una cadena con la version de DB API que utiliza. Ac- 
tualmente solo puede tomar como valor "1.0" o "2.0". Si la variable 
no existe se asume que es 1.0. 

threadsaf ety: se trata de un entero de 0 a 3 que describe lo seguro 
que es el modulo para el uso con threads. Si es 0 no se puede com- 
partir el modulo entre threads sin utilizar algun tipo de mecanis- 
mo de sincronizacion; si es 1, pueden compartir el modulo pero no 
las conexiones; si es 2, modulos y conexiones pero no cursores y, 
por ultimo, si es 3, es totalmente thread-safe. 

paramstyle: informa sobre la sintaxis a utilizar para insertar valores 
en la consulta SQL de forma dinamica. 

qmark: interrogaciones. 

sql = "select all from t where valor=?" 

numeric: un numero indicando la position. 

sql = "select all from t where valor=:1" 

named: el nombre del valor. 
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sql = "select all from t where valor=: valor" 
format: especificadores de formato similares a los del printf 
de C. 

sql = "select all from t where valor=%s" 
• pyf ormat: similar al anterior, pero con las extensiones de 
Python. 

sql = "select all from t where valor=%( valor ) " 

Veamos los valores correspondientes a sqlite3: 

»> import sqlite3 as dbapi 

>» print dbapi .apilevel 
2.0 

>» print dbapi . threadsafety 
1 

>» print dbapi .paramstyle 
qmark 



Excepciones 

A continuation podeis encontrar la jerarquia de excepciones que deben 
proporcionar los modulos, junto con una pequena description de cada 
exception, a modo de referencia. 

StandardError 

I Warning 

I Error 

I Interf aceError 

I DatabaseError 

I DataError 

I OperationalError 

I IntegrityError 

I InternalError 

I ProgrammingError 

I NotSupportedError 

• StandardError: Super clase para todas las excepciones de DB API. 

• Warning: Exception que se lanza para avisos importantes. 

• Error: Super clase de los errores. 

• Interf aceError: Errores relacionados con la interfaz de la base de 
datos, y no con la base de datos en si. 

• DatabaseError: Errores relacionados con la base de datos. 

• DataError: Errores relacionados con los datos, como una division 
entre cero. 



119 



Python para todos 



• OperationalError: Errores relacionados con el fiincionamiento de 
la base de datos, como una desconexion inesperada. 

• IntegrityError: Errores relacionados con la integridad referencial. 

• InternalError: Error interno de la base de datos. 

• ProgrammingError: Errores de programacion, como errores en el 
codigo SQL. 

• NotSupportedError: Excepcion que se lanza cuando se solicita un 
metodo que no esta soportado por la base de datos. 

Uso basico de DB-API 

Pasemos ahora a ver como trabajar con nuestra base de datos a traves 
de DB-API. 

Lo primero que tendremos que hacer es realizar una conexion con el 
servidor de la base de datos. Esto se hace mediante la funcion connect, 
cuyos parametros no estan estandarizados y dependen de la base de 
datos a la que estemos conectandonos. 

En el caso de sqlite3 solo necesi tamos pasar como parametro una 
cadena con la ruta al archivo en el que guardar los datos de la base de 
datos, o bien la cadena " : memory : " para utilizar la memoria RAM en 
lugar de un fichero en disco. 

Por otro lado, en el caso de MySQLdb, connect toma como parametros 
la maquina en la que corre el servidor (host), el puerto (port), nombre 
de usuario con el que autenticarse (user), contrasena (password) y base 
de datos a la que conectarnos de entre las que se encuentran en nuestro 
SGBD (db). 

La funcion connect devuelve un objeto de tipo Connection que repre- 
senta la conexion con el servidor. 

»> bbdd = dbapi.connectCbbdd.dat") 
>» print bbdd 

<sqlite3 .Connection object at 0x00A71DA®> 

Las distintas operaciones que podemos realizar con la base de datos se 
realizan a traves de un objeto Cursor. Para crear este objeto se utiliza el 
metodo cursor () del objeto Connection: 
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c = bbdd . cursor ( ) 

Las operaciones se ejecutan a traves del metodo execute de Cursor, pa- 
sando como parametro una cadena con el codigo SQL a ejecutar. 

Como ejemplo creemos una nueva tabla empleados en la base de datos: 

c . execute( "" "create table empleados (dni text, 
nombre text, 
departamento text)""") 

y a continuation, insertemos una tupla en nuestra nueva tabla: 

c.execute("""insert into empleados 

values ( ' 12345678-A' , 'Manuel Gil', 'Contabili- 

dad' )' ) 

Si nuestra base de datos soporta transacciones, si estas estan activadas, 
y si la caracteristica de auto-commit esta desactivada, sera necesario 
llamar al metodo commit de la conexion para que se lleven a cabo las 
operaciones definidas en la transaction. 

Si en estas circunstancias utilizaramos una herramienta externa para 
comprobar el contenido de nuestra base de datos sin hacer primero el 
commit nos encontrariamos entonces con una base de datos vacia. 

Si comprobaramos el contenido de la base de datos desde Python, sin 
cerrar el cursor ni la conexion, recibiriamos el resultado del contexto 
de la transaction, por lo que pareceria que se han llevado a cabo los 
cambios, aunque no es asi, y los cambios solo se aplican, como comen- 
tamos, al llamar a commi t. 

Para bases de datos que no soporten transacciones el estandar dic- 
ta que debe proporcionarse un metodo commit con implementation 
vacia, por lo que no es mala idea llamar siempre a commit aunque no 
sea necesario para poder cambiar de sistema de base de datos con solo 
modificar la linea del import. 

Si nuestra base de datos soporta la caracteristica de rollback tambien 
podemos cancelar la transaction actual con: 
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bbdd. rollback () 

Si la base de datos no soporta rollback llamar a este metodo producira 
una exception. 

Veamos ahora un ejemplo completo de uso: 

import sqlite3 as dbapi 

bbdd = dbapi.connectCbbdd.dat") 
cursor = bbdd. cursor( ) 

cursor. execute( "" "create table empleados (dni text, 
nombre text, 
departamento text)""") 

cursor. execute("""insert into empleados 

values ( ' 12345678-A' , 'Manuel Gil', 'Con- 

tabilidad' ) ) 
bbdd. commit () 

cursor . execute( "" "select * from empleados 

where departamento='Contabilidad' """) 

for tupla in cursor . fetchall () : 
print tupla 

Como vemos, para realizar consultas a la base de datos tambien se 
utiliza execute. Para consultar las tuplas resultantes de la sentencia 
SQL se puede llamar a los metodos de Cursor f etchone, f etchmany o 
fetchall o usar el objeto Cursor como un iterador. 

cursor . execute( "" "select * from empleados 

where departamento='Contabilidad' """) 

for resultado in cursor: 
print tupla 

El metodo f etchone devuelve la siguiente tupla del conjunto resultado 
o None cuando no existen mas tuplas, f etchmany devuelve el numero de 
tuplas indicado por el entero pasado como parametro o bien el nu- 
mero indicado por el atributo Cursor . arraysize si no se pasa ningun 
parametro (Cursor . arraysize vale 1 por defecto) y fetchall devuelve 
un objeto iterable con todas las tuplas. 
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A la hora de trabajar con selects u otros tipos de sentencias SQL es 
importante tener en cuenta que no deberian usarse los metodos de 
cadena habituales para construir las sentencias, dado que esto nos haria 
vulnerables a ataques de inyeccion SQL, sino que en su lugar debe 
usarse la caracteristica de sustitucion de parametros de DB API. 

Supongamos que estamos desarrollando una aplicacion web con 
Python para un banco y que se pudiera consultar una lista de sucur- 
sales del banco en una ciudad determinada con una URL de la forma 
http://www.mibanco.com/sucursales?ciudad=Madrid 

Podriamos tener una consulta como esta: 

cursor. execute("""select * from sucursales 

where ciudad="' + ciudad + ") 

A primera vista podria parecer que no existe ningun problema: no 
hacemos mas que obtener las sucursales que se encuentren en la ciudad 
indicada por la variable ciudad. Pero, ^que ocurriria si un usuario ma- 
lintencionado accediera a una URL como "http://www.mibanco.eom/s 
ucursales?ciudad=Madrid';SELECT * FROM contrasenyas"? 

Como no se realiza ninguna validation sobre los valores que puede 
contener la variable ciudad, seria sencillo que alguien pudiera hacerse 
con el control total de la aplicacion. 

Lo correcto seria, como deci'amos, utilizar la caracteristica de sustitu- 
cion de parametros de DB API. El valor de paramstyle para el modulo 
sqlite3 era qmark. Esto significa que debemos escribir un signo de 
interrogation en el lugar en el que queramos insertar el valor, y basta 
pasar un segundo parametro a execute en forma de secuencia o map- 
ping con los valores a utilizar para que el modulo cree la sentencia por 
nosotros. 

cursor . execute( "" "select * from sucursales 
where ciudad=?""", (ciudad,)) 

Por ultimo, al final del programa se debe cerrar el cursor y la conexion: 
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cursor . close( ) 
bbdd. close( ) 



Tipos SQL 

En ocasiones podemos necesitar trabajar con tipos de SQL, y almace- 
nar, por ejemplo, fechas u horas usando Date y Time y no con cadenas. 
La API de bases de datos de Python incluye una serie de constructores 
a utilizar para crear estos tipos. Estos son: 

• Date(year, month, day ): Para almacenar fechas. 

• Time(hour, minute, second): Para almacenar horas. 

• Timestamp(year , month, day, hour, minute, second): Para 
almacenar timestamps (una fecha con su hora). 

• Da teFromTicks( ticks): Para crear una fecha a partir de un numero 
con los segundos transcurridos desde el epoch (el 1 de Enero de 
1970 a las 00:00:00 GMT). 

• TimeFromTicks(ticks): Similar al anterior, para horas en lugar de 
fechas. 

• TimestampFromTicks(ticks): Similar al anterior, para timestamps. 

• Binary ( string): Valor binario. 



Otras opciones 

Por supuesto no estamos obligados a utilizar DB-API, ni bases de 
datos relacionales. En Python existen modulos para trabajar con bases 
de datos orientadas a objetos, como ZODB (Zope Object Database) 
y motores para mapeo objeto-relacional (ORM) como SQLAlchemy, 
SQLObject o Storm. 

Ademas, si utilizamos IronPython en lugar de CPython tenemos la 
posibilidad de utilizar las conexiones a bases de datos de .NET, y si 
utilizamos Jython, las de Java. 
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Docstrings 

En capftulos anteriores ya comentamos en varias ocasiones que todos 

los objetos cuentan con una variable especial doc mediante la que 

indicar el proposito y uso del objeto. Estos son los llamados docstrings 
o cadenas de documentacion. 

A estos atributos se les puede asociar el texto correspondiente expli'ci- 
tamente, asignandolo al literal cadena correspondiente, como con cual- 
quier otra variable. Sin embargo, por conveniencia, Python ofrece un 
mecanismo mucho mas sencillo y es que si el primer estamento de la 

definition del objeto es una cadena, esta se asocia a la variable doc 

automaticamente. 

def haz_algo(arg) : 

"""Este es el docstring de la funcion.""" 
print arg 

print haz_algo. doc 

haz_algo. doc = """Este es un nuevo docstring.""" 

print haz_algo. doc 

Como vemos lo interesante de estas cadenas es que, a diferencia de los 
comentarios normales de Python y de los comentarios de otros lengua- 
jes, las cadenas de documentacion no se eliminan del bytecode, por lo 
que se pueden consultar en tiempo de ejecucion, usando, por ejemplo, 
la funcion help del lenguaje, o utilizando la sentencia print como en el 
ejemplo anterior. 

»> help(haz_algo) 

Help on function haz_algo in module main : 

haz_algo(arg) 
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Este es un nuevo docstring. 

Pydoc 

La funcion help, que comentamos brevemente con anterioridad, 
utiliza el modulo pydoc para generar la documentacion de un objeto a 
partir de su docstring y los docstrings de sus miembros. Este modulo, 
incluido por defecto con Python desde la version 2.1, se puede impor- 
tar en nuestro codigo Python y utilizarse programaticamente, o bien se 
puede utilizar como una herramienta de h'nea de comandos que seria el 
equivalente a la aplicacion Javadoc del mundo Java. 

pydoc puede mostrar la information como texto en la consola, tal como 
lo utiliza help, pero tambien puede generar archivos HTML como 
javadoc o facilitar la information a traves de un pequeno servidor web 
incluido con el modulo. 

Pydoc es muy sencillo de utilizar. Con 
pydoc. py nombrel [nombre2 ...] 

se muestra la documentacion del tema, modulo, clase, paquete, fun- 
cion o palabra clave indicada de forma similar a la funcion help. Si el 
nombre es keywords, topics o modules se listaran las distintas palabras 
claves, temas y modulos respectivamente. 

Si se pasa el flag -w, el script guardara la documentacion en uno o 
varios archivos html en lugar de mostrarla por pantalla. 

pydoc. py -w nombrel [nombre2 ...] 

El flag - k sirve para buscar una determinada palabra en las sinopsis 
de todos los modulos disponibles. La sinopsis es la primera lmea de la 
cadena de documentacion. 

pydoc. py -k xml 

Con -p podemos iniciar el servidor HTTP en el puerto indicado. 
pydoc. py -p puerto 
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Una vez hecho esto podemos acceder a la documentacion de todos 
los modulos disponibles abriendo la pagina http://localhost:puerto en 
nuestro navegador. 

Por ultimo, mediante el flag - g podemos lanzar una interfaz grafica 
para buscar documentacion que utiliza el servidor HTTP para mostrar 
los resultados. 

Epydoc y reStructuredText 

El problema de pydoc es que es muy simple, y no permite anadir 
semantica o modificar estilos de la documentacion. No podemos, por 
ejemplo, indicar que en una li'nea en concreto de entre las li'neas de 
documentacion de la funcion describe un parametro de la funcion o 
mostrar un cierto termino en cursiva. 

Existen proyectos para generar documentacion con funcionalidades 
mas avanzadas como Docutils, Epydoc o Sphinx, aunque es necesario 
aprender sintaxis especiales. 

Docutils es un proyecto desarrollado por David Goodger que in- 
cluye distintas herramientas para generar documentacion utilizando 
el formato reStructuredText, un formato de texto piano creado por 
el mismo autor, y que es el formato mas utilizado en la comunidad 
Python. reStructuredText se utiliza, entre otros, para la creation de los 
PEPs (Python Enhancement Proposals). 

Sin embargo, actualmente Docutils es mas indicado para generar 
documentos a partir de archivos de texto, y no a partir de docstrings 
extraidos de codigo fuente Python, ya que el parser encargado de este 
trabajo dista mucho de estar terminado. 

EpyDoc es una de las herramientas de generation de documentacion 
para Python mas utilizadas. Ademas de texto piano y de su propio 
formato, llamado epytext, soporta reStructuredText y sintaxis Javadoc, 
cosa que los programadores Java agradeceran. 

A lo largo del resto del capi'tulo utilizaremos reStructuredText como 
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lenguaje de marcado y EpyDoc para generar los documentos finales. 

Epydoc se puede descargar desde su pagina web en forma de instala- 
dor exe para Windows, paquete RPM para Fedora o similares, o en 
archivos zip y tar.gz que incluyen scripts de instalacion: http://epyd.oc. 
sourceforge. net/. Tambien se encuentra en los repositorios de varias 
distribuciones Linux. 

Una vez hayamos instalado Epydoc siguiendo el metodo adecuado 
para nuestro sistema operativo tendremos acceso a su funcionalidad 
a traves de dos interfaces de usuario distintas: el script epydoc, que 
consiste en una aplicacion de li'nea de comandos, y el script epydocgui 
(epydoc . pyw en Windows), que ofrece una interfaz grafica. Ademas 
tambien podemos acceder a la funcionalidad de epydoc programatica- 
mente, como en el caso de pydoc. 

Vamos a crear un pequeno modulo con un par de clases para ver pri- 
mero el resultado de utilizar epydoc con docstrings de texto piano, sin 
ningun tipo de marcado especial. 

"""Modulo para ejemplificar el uso de epydoc.""" 

class Persona: 

"""Mi clase de ejemplo.""" 
def init (self, nombre): 

' Inicializador de la clase Persona.""" 

self. nombre = nombre 

self .mostrar_nombre( ) 

def mostrar_nombre(self ) : 

' Imprime el nombre de la persona""" 
print "Esta es la persona %s" % self .nombre 

class Empleado(Persona) : 

"""Subclase de Persona.""" 
pass 

if name == " main ": 

raul = Persona("Raul") 

El formato de salida por defecto de epydoc es HTML. Por lo tanto 
para generar la documentation en forma de documentos HTML bas- 
taria escribir algo asi: 
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epydoc ejemplo.py 
o bien 

epydoc --html ejemplo.py 

Para generar un archivo PDF, utilizando LaTeX, se utilizaria el flag 
--pdf: 

epydoc --pdf ejemplo.py 

Si LaTeX no esta instalado o epydoc no encuentra el ejecutable no sera 
posible generar el PDF. 

Tambien podemos indicar el nombre del proyecto y la URL mediante 
las opciones - -name y - -url: 

epydoc --name Ejemplo --url http://mundogeek.net ejemplo.py 

E incluso anadir diagramas mostrando la clase base y subclases 
(--graph classtree), las llamadas entre funciones y metodos (--graph 
callgraph), clases y subclases usando notation UML (--graph uml- 
c lass tree) o todos ellos ( - - graph all). 

epydoc --graph all ejemplo.py 

Para generar el grafo de llamadas, no obstante, es necesario generar 
un archivo con la information necesaria utilizando el modulo profile 
o el modulo hotshot e indicar el archivo resultante utilizando el flag 
- -pstat: 

epydoc --graph all --pstat profile. out ejemplo.py 

Veamos ahora algunas funcionalidades basicas de marcado en reStruc- 
turedText. 

Para poner un texto en italica se rodea el texto con asteriscos: 
*italica* -> italica 
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Para ponerlo en negrita, se utilizan dos asteriscos: 

**negrita** -> negrita 

Para mostrar el texto como monoespacio, por ejemplo para mostrar 
codigo inline, se utiliza ". 

"monoespacio" -> monoespacio 

Si necesitamos utilizar cualquiera de estos caracteres especiales, se 
pueden escapar utilizando la barra invertida. 

\* es un caracter especial -> * es un caracter especial 

Los titulos se crean anadiendo una linea de caracteres no alfanumeri- 
cos por debajo del texto, o por encima y por debajo del texto. Para crear 
un subtitulo basta utilizar una nueva combination. 

Tltulo 



Subtitulo 



Titulo 

Subtitulo 

Para crear una lista no ordenada se empieza cada linea con el caracter 
*, - o +: 

* Python 

* C 

* Java 

Python 

* C 

* Java 

Para crear una lista numerada se empieza la linea con el numero se- 
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guido de un punto, o bien con el simbolo '#' para que se introduzca el 
numero automaticamente. 

1. Python 

2. C 

3. Java 

1. Python 

2. C 

3. Java 

Para describir propiedades de los elementos que estamos documen- 
tando se utilizan los campos o fields. En reStructuredText los campos 
comienzan con ':', le sigue el nombre del campo y opcionalmente sus 
argumentos, y se cierra de nuevo con para terminar con el cuerpo 
del campo. 



Estos son algunos de los campos que soporta Epydoc: 



Funciones y metodos 


:param p: Un parametro 


Describe el parametro p. 


:type p: str 


Especifica el tipo esperado para el 
parametro p. 


:return: True si son 
iguales 


Valor de retorno. 


:rtype: str 


Tipo del valor de retorno. 


:keyword p: Un parame- 
tro 


Description del parametro con 
valor por defecto y nombre p. 


:raise e: Si el parame- 
tro es cero 


Describe las circunstancias para 
las que se lanza la exception e. 




Variables 


: ivar v: Una variable 


Description de la instancia v. 


:cvar v: Una variable 


Description de la variable estatica 
de clase v. 


:var v: Una variable 


Description de la variable v del 
modulo. 
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: type v: str 


Tipo de la variable v. 




Notas 


:note: Una nota 


Una nota sobre el objeto. 


:attention: Importante 


Una nota importante sobre el 
objeto. 


:bug: No funciona para 
el valor 0 


Description de un error en el 
objeto. 


:warning: Cuidado con 
el valor 0 


Una advertencia acerca de un 
objeto. 


:see: Ver 'Python para 
todos ' 


Para indicar information relacio- 
nada. 




Estado 


: version : 1.0 


Version actual del objeto. 


:change: Version ini - 
cial 


Listado de cambios. 


:todo: Internacional i - 
zacion 


Un cambio planeado para el 
objeto. 


:status: Version esta- 
ble 


Estado del objeto. 




Autoria 


:author: Raul Gonzalez 


Autor o autores del objeto. 


:organization: Mundo 
geek 


Organization que creo o mantiene 
el objeto. 


:license: GPL 


Licencia del objeto. 


: contact : zootropo en 
gmail 


Information de contacto del autor. 



Para que Epydoc sepa que utilizamos reStructuredText es necesario 

indicarlo mediante una variable docf ormat en el codigo, o bien 

mediante la option - -docf ormat de linea de comandos. Las opciones 
posibles son epytext, plaintext, restructuredtext o javadoc. 
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Veamos un ejemplo con campos: 

"""Modulo para ejemplificar el uso de *epydoc*. 
:author: Raul Gonzalez 
: vers ion: 0.1""" 

docformat = "restructuredtext" 

class Persona: 

Modela una persona.' 

def init (self, nombre, edad): 

' Inicializador de la clase 'Persona 1 . 
:param nombre: Nombre de la persona. 
:param edad: Edad de la persona""" 
self. nombre = nombre 
self. edad = edad 
self .mostrar_nombre( ) 

def mostrar_nombre(self ) : 

' Imprime el nombre de la persona""" 
print "Esta es la persona %s" % self .nombre 

class Empleado(Persona) : 

"""Subclase de 'Persona 1 correspondiente a las personas 
que trabajan para la organizacion . 
:todo: Escribir implementacion . ' 
pass 

if name == " main ": 

juan = Persona( " Juan" , 26) 

reStructuredText tambien soporta un segundo tipo de campos en el 
que el cuerpo del campo es una lista. De esta forma podemos, por 
ejemplo, describir todos los parametros de una funcion o metodo con 
un solo campo : Parameters :, en lugar de con un campo : par am: para 
cada parametro. 

class Persona: 

Modela una persona. 

def init (self, nombre, edad): 

' Inicializador de la clase 'Persona 1 . 

: Parameters : 

- "nombre 1 : Nombre de la persona. 

- "edad 1 : Edad de la persona. 



self. nombre = nombre 
self. edad = edad 
self .mostrar_nombre( ) 
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Otros campos que admiten listas son : Exceptions: para indicar varias 
excepciones (: except :), :Variables: para comentar varias variables 
(:var:)o :Ivariables: para comentar varias instancias (: ivar:). 



134 



PRUEBAS 



Para asegurar en la medida de lo posible el correcto funcionamiento 
y la calidad del software se suelen utilizar distintos tipos de pruebas, 
como pueden ser las pruebas unitarias, las pruebas de integration, o las 
pruebas de regresion. 

A lo largo de este capi'tulo nos centraremos en las pruebas unitarias, 
mediante las que se comprueba el correcto funcionamiento de las 
unidades logicas en las que se divide el programa, sin tener en cuenta 
la interrelation con otras unidades. 



La solution mas extendida para las pruebas unitarias en el mundo 
Python es unittest, a menudo combinado con doctest para pruebas 
mas sencillas. Ambos modulos estan incluidos en la libreria estandar 
de Python. 



Doctest 

Como es de suponer por el nombre del modulo, doctest permite 
combinar las pruebas con la documentation. Esta idea de utilizar las 
pruebas unitarias para probar el codigo y tambien a modo de docu- 
mentation permite realizar pruebas de forma muy sencilla, propicia el 
que las pruebas se mantengan actualizadas, y sirve a modo de ejemplo 
de uso del codigo y como ayuda para entender su proposito. 



Cuando doctest encuentra una lfnea en la documentation que co- 
mienza con ' »> ' se asume que lo que le sigue es codigo Python a 
ejecutar, y que la respuesta esperada se encuentra en la lfnea o lineas 
siguientes, sin >». El texto de la prueba termina cuando se encuentra 
una lmea en bianco, o cuando se llega al final de la cadena de docu- 
mentation. 
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Tomemos como ejemplo la siguiente funcion, que devuelve una lista 
con los cuadrados de todos los numeros que componen la lista pasada 
como parametro: 

def cuadrados( lista) : 

"""Calcula el cuadrado de los numeros de una lista""" 

return [n ** 2 for n in lista] 

Podriamos crear una prueba como la siguiente, en la que comprobamos 
que el resultado al pasar la lista [ 0 , 1 , 2 , 3 ] es el que esperabamos: 

def cuadrados( lista) : 

"""Calcula el cuadrado de los numeros de una lista 

»> 1 = [0, 1, 2, 3] 
»> cuadrados(l) 
[0, 1, 4, 9] 

II ti n 

return [n ** 2 for n in lista] 

Lo que hacemos en este ejemplo es indicar a doctest que cree un lista 1 
con valor [0, 1, 2, 3], que llame a continuacion a la funcion cuadra- 
dos con 1 como argumento, y que compruebe que el resultado devuelto 
sea igual a [ 0 , 1 , 4 , 9 ] . 

Para ejecutar las pruebas se utiliza la funcion testmod del modulo, a la 
que se le puede pasar opcionalmente el nombre de un modulo a eva- 
luar (parametro name). En el caso de que no se indique ningun argu- 
mento, como en este caso, se evalua el modulo actual: 

def cuadrados( lista) : 

"""Calcula el cuadrado de los numeros de una lista 

»> I = [0, 1, 2, 3] 
»> cuadrados(l) 
[0, 1, 4, 9] 

II ti n 

return [n ** 2 for n in lista] 

def _test(): 

import doctest 
doctest . testmod( ) 
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if name == " main ": 

_test() 

En el caso de que el codigo no pase alguna de las pruebas que hemos 
definido, doctest mostrara el resultado obtenido y el resultado espe- 
rado. En caso contrario, si todo es correcto, no se mostrara ningun 
mensaje, a menos que anadamos la option -v al llamar al script o el pa- 
rametro verbose=True a la funcion tesmod, en cuyo caso se mostraran 
todas las pruebas ejecutadas, independientemente de si se ejecutaron 
con exito. 



Este seria el aspecto de la salida de doctest utilizando el parametro -v: 

Trying : 

I = [®, 1, 2, 3] 
Expecting nothing 

ok 

Trying : 

cuadrados( I ) 
Expecting : 

[0, 1, 4, 9] 

ok 

2 items had no tests: 

main 

main ._test 

1 items passed all tests: 

2 tests in main .cuadrados 

2 tests in 3 items. 

2 passed and 0 failed. 
Test passed. 

Ahora vamos a introducir un error en el codigo de la funcion para 
ver el aspecto de un mensaje de error de doctest. Supongamos, por 
ejemplo, que hubieramos escrito un operador de multiplication ( ' * 1 ) 
en lugar de uno de exponentiation ( ' * * ' ): 

def cuadrados( lista) : 

"""Calcula el cuadrado de los numeros de una lista 

»> 1 = [0, 1, 2, 3] 
»> cuadrados(l) 
[0, 1, 4, 9] 

II ti n 

return [n * 2 for n in lista] 
def _test(): 
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import doctest 
doctest . testmod( ) 

if name == " main ": 

_test() 

Obtendriamos algo parecido a esto: 

********************************************************* 

File "ejemplo.py" , line 5, in main .cuadrados 

Failed example: 

cuadrados(l) 
Expected : 

[0, 1, 4, 9] 

Got : 

[0, 2, 4, 6] 

********************************************************* 

1 items had failures: 

1 of 2 in main .cuadrados 

***Test Failed*** 1 failures. 



Como vemos, el mensaje nos indica que ha fallado la prueba de la linea 
5, al llamar a cuadrados (1), cuyo resultado deberfa ser [0, 1, 4, 9],y 
sin embargo obtuvimos [ 0 , 2 , 4 , 6 ] . 

Veamos por ultimo como utilizar sentencias anidadas para hacer cosas 
un poco mas complicadas con doctest. En el ejemplo siguiente nuestra 
funcion calcula el cuadrado de un unico numero pasado como para- 
metro, y disenamos una prueba que compruebe que el resultado es el 
adecuado para varias llamadas con distintos valores. Las sentencias 
anidadas comienzan con " ..." en lugar de "»>": 

def cuadrado(num) : 

"""Calcula el cuadrado de un numero. 

»> 1 = [0, 1, 2, 3] 
»> for n in 1: 

cuadrado(n) 
[0, 1, 4, 9] 

II tl II 

return num ** 2 

def _test(): 

import doctest 
doctest . testmod( ) 
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if name == " main 

_test() 



unittest / PyUnit 

unittest, tambien llamado PyUnit, forma parte de una familia de 
herramientas conocida colectivamente como xUnit, un conjunto de 
frameworks basados en el software SUnit para Smalltalk, creado por 
Kent Beck, uno de los padres de la eXtreme Programming. Otros 
ejemplos de herramientas que forman parte de esta familia son JUnit 
para Java, creada por el propio Kent Beck junto a Erich Gamma, o 
NUnit, para .NET. 

El uso de unittest es muy sencillo. Para cada grupo de pruebas tene- 
mos que crear una clase que herede de unittest .TestCase,y anadir 
una serie de metodos que comiencen con test, que seran cada una de 
las pruebas que queremos ejecutar dentro de esa bateria de pruebas. 

Para ejecutar las pruebas, basta llamar a la funcion main( ) del modulo, 
con lo que se ejecutaran todos los metodos cuyo nombre comience con 
test, en orden alfanumerico. Al ejecutar cada una de las pruebas el 
resultado puede ser: 

• OK: La prueba ha pasado con exito. 

• FAIL: La prueba no ha pasado con exito. Se lanza una excepcion 
Assert ionError para indicarlo. 

ERROR: Al ejecutar la prueba se lanzo una excepcion distinta de 
AssertionError. 



En el siguiente ejemplo, dado que el metodo que modela nuestra prue- 
ba no lanza ninguna excepcion, la prueba pasaria con exito. 

import unittest 

class EjemploPruebas( unit test .TestCase) : 
def test(self ) : 
pass 

if name == " main ": 

unittest .main( ) 
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En este otro, sin embargo, fallaria: 
import unittest 

class E jemploPruebas( unit test .TestCase) : 
def test(self): 

raise AssertionError( ) 

if name == " main ": 

unittest .main( ) 



Nada nos impide utilizar clausulas i f para evaluar las condiciones que 
nos interesen y lanzar una excepcion de tipo AssertionError cuando 
no sea asf, pero la clase TestCase cuenta con varios metodos que nos 
pueden facilitar la tarea de realizar comprobaciones sencillas. Son los 
siguientes: 

• assertAlmostEqual(f irst , second, places=7, msg=None): 
Comprueba que los objetos pasados como parametros sean iguales 
hasta el septimo decimal (o el numero de decimales indicado por 
places). 

• assertEqual(f irst , second, msg=None): Comprueba que los 
objetos pasados como parametros sean iguales. 

• assertFalse(expr , msg=None): Comprueba que la expresion sea 
falsa. 

• assertNotAlmostEqual(f irst , second, places=7, msg=None): 
Comprueba que los objetos pasados como parametros no sean 
iguales hasta el septimo decimal (o hasta el numero de decimales 
indicado por places). 

• assertNotEqual(f irst , second, msg=None): Comprueba que los 
objetos pasados como parametros no sean iguales. 

• assertRaises(excClass , callableObj, *args, **kwargs): 
Comprueba que al llamar al objeto cal lableOb j con los parame- 
tros definidos por *args y **kwargs se lanza una excepcion de tipo 
excClass. 

• assertTrue(expr , msg=None): Comprueba que la expresion sea 
cierta. 

• assert_(expr , msg=None): Comprueba que la expresion sea cierta. 

• fail(msg=None): Falla inmediatamente. 

• faillf(expr, msg=None): Falla si la expresion es cierta. 

• f ailIfAlmostEqual(f irst , second, places=7, msg=None): Falla 
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si los objetos pasados como parametros son iguales hasta el septi- 
mo decimal (o hasta el numero de decimales indicado por places). 

• f aillf Equal(f irst , second, msg=None): Falla si los objetos pasa- 
dos como parametros son iguales. 

• f ailUnless(expr , msg=None): Falla a menos que la expresion sea 
cierta. 

• failUnlessAlmostEqual(f irst , second, places=7, msg=None): 
Falla a menos que los objetos pasados como parametros sean 
iguales hasta el septimo decimal (o hasta el numero de decimales 
indicado por places). 

• failUnlessEqual(f irst , second, msg=None): Falla a menos que 
los objetos pasados como parametros sean iguales. 

• f ailUnlessRaises(excClass , callableObj, *args, **kwargs): 
Falla a menos que al llamar al objeto callableObj con los parame- 
tros definidos por *args y **kwargs se lance una excepcion de tipo 
excClass. 

Como vemos todos los metodos cuentan con un parametro opcional 
msg con un mensaje a mostrar cuando dicha comprobacion falle. 

Retomemos nuestra pequena funcion para calcular el cuadrado de un 
numero. Para probar el funcionamiento de la funcion podriamos hacer, 
por ejemplo, algo asi: 

import unittest 

def cuadrado(num) : 

"""Calcula el cuadrado de un numero.""" 

return num ** 2 

class EjemploPruebas( unit test .TestCase) : 
def test(self ) : 

1 = [0, 1, 2, 3] 

r = [cuadrado(n) for n in 1] 

self .assertEqual(r , [0, 1, 4, 9]) 

if name == " main ": 

unittest .main( ) 

Preparacion del contexto 

En ocasiones es necesario preparar el entorno en el que queremos que 
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se ejecuten las pruebas. Por ejemplo, puede ser necesario introducir 
unos valores por defecto en una base de datos, crear una conexion con 
una maquina, crear algun archivo, etc. Esto es lo que se conoce en el 
mundo de xUnit como test fixture. 

La clase Test Case proporciona un par de metodos que podemos sobre- 
escribir para construir y desconstruir el entorno y que se ejecutan antes 
y despues de las pruebas definidas en esa clase. Estos metodos son 
setUp( ) y tearDown( ). 

class E jemp loFixture( unit test .TestCase) : 
def setUp(self): 

print "Preparando contexto" 
self . lista = [0, 1 , 2, 3] 

def test(self ) : 

print "Ejecutando prueba" 

r = [cuadrado(n) for n in self. lista] 

self .assertEqual(r , [0, 1, 4, 9]) 

def tearDown(self ) : 

print "Desconstruyendo contexto" 
del self. lista 
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Una vez terminemos con el desarrollo de nuestra nueva aplicacion es 
conveniente empaquetarla de forma que sea sencillo para los usuarios 
instalarla, y para nosotros distribuirla. 

En Python existen dos modulos principales para este cometido: distu- 
tils, que es parte de la libreria estandar y era el metodo mas utilizado 
hasta hace poco,y setuptools, que extiende la funcionalidad de distu- 
t i I s y es cada vez mas popular. 

En este capi'tulo veremos el funcionamiento de ambas herramientas, y 
terminaremos explicando como crear ejecutables .exe para Windows a 
partir de nuestro programa en Python. 



distutils 

Todo programa distribuido con distutils contiene un script llama- 
do por convention setup.py, que se encarga de instalar la aplicacion 
llamando a la funcion setup de distutils. core. Esta funcion tiene 
montones de argumentos, que controlan, entre otras cosas, como insta- 
lar la aplicacion. 



Destinados a describir la aplicacion tenemos los siguientes argumen- 
tos: 
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• name: El nombre del paquete. 

• version: El numero de version. 

• description: Una linea describiendo el paquete. 

• long_description: Description completa del paquete. 

• author: Nombre del autor de la aplicacion. 

• author_email: Correo electronico del autor. 

• maintainer: Nombre de la persona encargada de mantener el 
paquete, si difiere del autor. 

• maintainer_email: Correo de la persona encargada de mantener el 
paquete, si difiere del autor. 

• url: Web de la aplicacion. 

• download_url: Url de la que descargar la aplicacion. 

• license: Licencia de la aplicacion 

Tambien tenemos argumentos que controlan los archivos y directo- 
ries que deben instalarse, como son packages, py_modules, scripts y 
ext_modules. 

El parametro scripts, que es una lista de cadenas, indica el nombre 
del modulo o modulos principales, es decir, los que ejecuta el usuario. 
Si nuestra aplicacion consistiera, por ejemplo, en un solo script ejem- 
plo.py, el codigo de setup.py podria tener un aspecto similar al siguien- 
te: 

from distutils.core import setup 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http: //mundogeek . net/ tutorial -python/" , 

license="GPL" , 

scrip ts=[ "ejemplo. py" ] 

) 

Si hemos escrito otros modulos para ser utilizados por el script prin- 
cipal, estos se indican mediante el parametro py_modules. Por ejemplo, 
supongamos que la aplicacion consiste en un script principal ejemplo. 
py, y un modulo de apoyo apoyo.py: 

from distutils.core import setup 
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setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils" , 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http: //mundogeek . net/ tutorial -python/" , 

license="GPL" , 

scrip ts=[ "ejemplo. py" ] , 

py_modules=[ "apoyo" ] 



Para instalar paquetes Python (directorios que contienen varios mo- 

dulos y un archivo init .py) usariamos el parametro packages. Si 

ademas del modulo ejemplo.py quisieramos instalar los paquetes gui y 
bbdd, por ejemplo, hariamos algo asi: 

from distutils. core import setup 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http : //mundogeek . net/ tutorial -python/" , 

license="GPL", 

scripts=["ejemplo.py"] , 

packages=[ "gui" , "bbdd"] 



ext_modules, por ultimo, sirve para incluir extensiones que utilice el 
programa, en C, C++, Fortran, . . . 

Veamos ahora como se utilizaria el archivo setup.py una vez creado. 

Al ejecutar el comando 

python setup.py install 



los modulos y paquetes especificados por py_modules y packages se 
instalan en el directorio Lib de Python. Los programas indicados en 
scripts, se copian al directorio Scripts de Python. 

Una vez hemos comprobado que la aplicacion se instala correctamente, 
procedemos a crear archivos mediante los que distribuir la aplicacion 
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a los usuarios. Para crear archivos con el codigo fuente se utiliza la op- 
tion sdist de setup.py, que crea por defecto un archivo tar.gz en Unix 
y un zip en Windows. 

python setup.py sdist 

Sin embargo se puede utilizar - - formats para especificar el formato o 
formatos que queramos generar 

bztar .tar.bz2 
gztar .tar.gz 
tar .tar 
zip .zip 
ztar .tar.Z 

Para crear un archivo tar.bz2, un tar.gz y un zip, por ejemplo, se utiliza- 
ria la siguiente orden: 

python setup.py sdist - -formats=bztar , gztar , zip 

Para generar un archivo de distribution binaria, se usa la option bdist: 
python setup.py bdist 

Los formatos que soporta bdist son los siguientes: 



rpm 


RPM 


gztar 


.tar.gz 


bztar 


.tar.bz2 


ztar 


.tar.Z 


tar 


.tar 


wininst 


Instalador Windows 


zip 


.zip 



Para crear un archivo rpm y un instalador de Windows, por ejemplo, 
escribiriamos: 



146 



Distribuir aplicaciones Python 



python setup. py bdist - -f ormats=wininst , rpm 

Tambien es posible crear otros tipos de archivos de distribution utili- 
zando scripts que extienden distutils, como es el caso de los paquetes 
deb mediante el script stdeb (http://stdeb.python-hosting.com/) 

setuptools 

setuptools extediende distutils anadiendo una serie de funcionalidades 
muy interesantes: introduce un nuevo formato de archivo para distri- 
bucion de aplicaciones Python llamado egg, se encarga de buscar todos 
los paquetes que deben instalarse y anadir las posibles dependencias, 
permite instalar paquetes de PyPI con un solo comando, etc. 

Ademas, como setuptools se basa en distutils, un script de instalacion 
basico utilizando setuptools es practicamente igual a su equivalente 
con distutils. Tan solo cambiaria la sentencia de importation. 

from setuptools import setup 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http : //mundogeek . net/ tutorial -python/" , 

license="GPL", 

scrip ts=[ "ejemplo. py" ] , 

) 

El unico inconveniente que podriamos encontrar al uso de setuptools 
es que no esta incluido por defecto en Python 2.5, aunque es probable 
que esto cambie en proximas versiones debido a su gran uso. Pero los 
desarrolladores de setuptools han pensado en todo, e incluso esto no 
deberia suponer ningun problema, ya que con un minimo esfuerzo 
por nuestra parte podemos hacer que setuptools se descargue e instale 
automaticamente en la maquina del usuario si este no se encuentra 
ya en el sistema. Basta distribuir con nuestro paquete un pequeno 
modulo extra ez_setup.py que viene incluido por defecto con setup- 
tools (http://peak.telecommunity.com/dist/ez_setup.py) yllamar a la 
funcion use_setuptools del modulo al inicio de setup.py: 
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from ez_setup import use_setuptools 
use_setuptools( ) 

from setuptools import setup 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http : //mundogeek . net/ tutorial -python/" , 

license="GPL" , 

scrip ts=[ "ejemplo. py" ] , 

) 

Veamos ahora con mas detenimiento algunos de los cambios y noveda- 
des que introduce setuptools. 

Integracion con PyPI 

Al estilo de CPAN en Perl setuptools permite instalar de forma facil 
y sencilla los paquetes pertenecientes a PyPI, el Indice de Paquetes 
Python (http://pypi.python.org/pypi), asi como subir nuestros propios 
paquetes. 

PyPI cuenta en el momento de escribir estas lineas con 4782 paquetes, 
por lo que poder instalar los paquetes de este repositorio con un simple 
comando supone una ayuda muy a tener en cuenta. 

Instalar un paquete de PyPI es tan sencillo como pasar al comando 
easy_install el nombre del paquete a instalar 

easy_install docutils 
Searching for docutils 

Reading http://pypi .python.org/simple/docutils/ 
Reading http : //docutils . sourcef orge .net/ 
Best match: docutils 0.5 

Downloading http: //prdown loads . sourcef orge . net/docutils/ 
docutils-0. 5 . tar . gz?download 
Processing docutils-0. 5 . tar .gz 

Running docutils-0 . 5/setup . py -q bdist_egg --dist-dir /tmp/ 
easy_install-wUAyUZ/docut ils-0 . 5/egg-dist - tmp-kWkkkv 
"optparse" module already present; ignoring extras/optparse . 

py- 

"textwrap" module already present; ignoring extras/textwrap . 

py- 

zip_safe flag not set; analyzing archive contentsD 
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docutils. writers. newlatex2e. init : module references 

file 

docutils.writers.pep_html. init : module references 

f ile__ 

docutils. writers. html4css1 . init : module references 

file 

docutils .writers . s5_html . init : module references 

file 

docutils.parsers.rst.directives.misc: module references 
file 

Adding docutils 0.5 to easy-install . pth file 

Installing rst2pseudoxml .py script to /usr/bin 

Installing rst2html.py script to /usr/bin 

Installing rst21atex.py script to /usr/bin 

Installing rst2s5.py script to /usr/bin 

Installing rst2newlatex.py script to /usr/bin 

Installing rstpep2html . py script to /usr/bin 

Installing rst2xml.py script to /usr/bin 

Installed /usr/lib/python2 . 5/site-packages/docutils-0. 5- 

py2.5.egg 

Processing dependencies for docutils 
Finished processing dependencies for docutils 

Poder subir nuestros paquetes a PyPI requiere de un proceso un poco 
mas laborioso. Primero registramos los detalles de nuestra aplicacion 
en PyPI mediante la option register del script setup.py, el cual nos 
preguntara por nuestro nombre de usuario, contrasena y correo electro- 
nico si no tenemos cuenta en PyPI, o nombre de usuario y contrasena 
si nos registramos anteriormente: 

python setup.py register 
running register 
running egg_info 

creating Aplicacion_de_e jemplo . egg- info 

writing Aplicacion_de_e jemplo. egg- info/PKG- INFO 

writing top-level names to Aplicacion_de_e jemplo . egg- info/ 

top_level . txt 

writing dependency_links to Aplicacion_de_e jemplo. egg-info/ 
dependency_links . txt 

writing manifest file 'Aplicacion_de_ejemplo.egg-info/SOUR- 
CES.txt' 

reading manifest file 'Aplicacion_de_ejemplo.egg-info/SOUR- 
CES.txt' 

writing manifest file 'Aplicacion_de_ejemplo.egg-info/SOUR- 
CES.txt' 

We need to know who you are, so please choose either: 

1. use your existing login, 

2. register as a new user, 

3. have the server generate a new password for you (and 
email it to you) , or 
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4. quit 

Your selection [default 1]: 1 
Username: zootropo 
Password : 

Server response (200): OK 

I can store your PyPI login so future submissions will be 
faster . 

(the login will be stored in /home/zootropo/ .pypirc) 
Save your login (y/N)?y 

Para crear y subir una distribution con el codigo fuente de nuestra 
aplicacion se utiliza la option sdist upload: 

python setup. py sdist upload 

Tambien podriamos crear y subir un egg (un formato de archivo para 
distribuir aplicaciones Python que veremos en la proxima section) 
utilizando la option bdist_egg upload: 

python setup. py bdist_egg upload 

O combinar los tres pasos en un solo comando: 

python setup. py register sdist bdist_egg upload 

Una vez subido el paquete cualquier persona podria instalarlo en su 
sistema utilizando easy_install, de la misma forma que cualquier otro 
paquete de PyPI: 

easy_install mi-paquete 

Eggs 

Los eggs (huevo en ingles) son archivos de extension .egg median te los 
que distribuir aplicaciones en Python. Serian algo asi como el equiva- 
lente a los archivos .jar del mundo Java. Son multiplataforma, permi- 
ten manejar dependencias, y permiten instalar distintas versiones del 
mismo paquete. 

La forma mas sencilla de instalar aplicaciones distribuidas como 
archivos egg es mediante el comando easy_install, el cual comentamos 
brevemente en el punto anterior al hablar sobre su uso para instalar 
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paquetes de PyPI. Para instalar un archivo egg no tenemos mas que 
pasarle el nombre del archivo al comando easy_install: 

easy_install mi-aplicacion.egg 

o bien podemos pasarle la URL de la que descargar el egg: 
easy_install http : //mundogeek . net/mi-aplicacion . egg 

Para construir nuestros propios eggs podemos utilizar el comando 
bdist_egg de setup.py, de forma similar a la manera en que construi'a- 
mos paquetes RPM o instaladores para Windows con distutils: 

python setup.py bdist_egg 

Otros cambios destacables 

Uno de los cambios mas interesantes es la incorporation de un nue- 
vo argumento para la funcion setup llamado instaU_requires, que 
consiste en una cadena o lista de cadenas que indica los paquetes de los 
que depende la aplicacion. Si nuestra aplicacion necesitara tener insta- 
lado el paquete apoyo para poder ejecutarse, por ejemplo, escribiriamos 
lo siguiente: 

install_requires = ["apoyo"] 

Y de esta forma, easy_install se encargaria de buscar e instalar el pa- 
quete si fuera necesario, bien en PyPI, o en cualquier otro repositorio 
indicado por el parametro dependency_links. 

Ademas podemos especificar que se necesita una version concreta 
del paquete requerido, que sea mayor o menor que una cierta version, 
o que no se trate de una version determinada utilizando operadores 
relacionales (==, !=, <, <=, >, >=): 

install_requires = ["apoyo >= 1.0 < 2.0"] 

Tambien existen argumentos similares para declarar paquetes que 
deben instalarse para poder ejecutar el script de instalacion (setup_re- 
quires), para poder ejecutar las posibles pruebas incluidas con el 
paquete (tests_require) y para conseguir funcionalidades adicionales 
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(extras_require, que consiste en este caso en un diccionario). 

setuptools incluye tambien atajos utiles, como la funcion f incLpacka- 
ges( ) que nos evita tener que listar todos y cada uno de los paquetes 
que utiliza nuestro script en el parametro packages, como era el caso 
de distutils: 

from ez_setup import use_setuptools 
use_setuptools( ) 

from setuptools import setup, f incLpackages 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http: //mundogeek . net/ tutorial -python/" , 

license="GPL" , 

scripts=["ejemplo.py"] , 

packages = f ind_packages( ) 



Crear ejecutables .exe 

Tanto en Mac OS como en la mayor parte de las distribuciones Linux 
el interprete de Python esta instalado por defecto, por lo que los 
usuarios de estos sistemas no tienen mayor complication a la hora de 
instalar y ejecutar aplicaciones escritas en Python. 

En el caso de Windows, esto no es asi, por lo que seria interesante 
que los usuarios de este sistema operativo no tuvieran que instalar el 
interprete de Python. Tambien seria interesante que nuestro programa 
consistiera en un archivo .exe en lugar de uno o varios archivos .py, 
para simplificar las cosas. 

Todo esto lo podemos lograr gracias a py2exe, una extension para 
distutils que, como su nombre indica, permite crear ejecutables para 
Windows a partir de codigo Python, y que permite ejecutar estas apli- 
caciones sin necesidad de tener instalado el interprete de Python en el 
sistema. 

Py2exe funciona examinando nuestro codigo fuente en busca de los 
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modulos y paquetes que utilizamos, compilandolos y construyendo un 
nuevo archivo que incluye estos archivos y un pequeno interprete de 
Python integrado. 

Para probar el funcionamiento de py2exe creemos un pequeno progra- 
ma ejemplo.py 

print "Soy un .exe" 

y el archivo setup.py correspondiente. Los cambios que tenemos que 
realizar a setup.py son sencillos: importar py2exe, y utilizar los argu- 
mentos console y windows para indicar el nombre del script o scripts 
que queramos convertir en ejecutables de consola o ejecutables de 
interfaz grafica, respectivamente. 

from distutils.core import setup 
import py2exe 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del funcionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http: //mundogeek . net/ tutorial -python/" , 

license="GPL" , 

scrip ts=[ "ejemplo.py" ] , 

console=[ "ejemplo. py" ] 

) 

Para crear el ejecutable, utilizamos una nueva opcion de h'nea de 
comandos para setup.py disponible tras importar el modulo y llamada, 
como no, py2exe: 

python setup.py py2exe 

Con esto py2exe generara un directorio build, con las librerias com- 
piladas, y un directorio dist, con los archivos que conforman nuestra 
aplicacion. 

Entre los archivos que podemos encontrar en dist tendremos uno 
o varios ejecutables con el mismo nombre que los scripts indicados 
en console y windows, un archivo python*.dll, que es el interprete de 
Python, y un archivo library.zip, que contiene varios archivos pyc que 
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son los modulos que utiliza la aplicacion compilados. 

Si queremos reducir el numero de archivos a distribuir, podemos utili- 
zar la option - -bundle de py2exe para anadir a library.zip las dll y los 
pyd (- -bundle 2) o las dll, los pyd y el interprete (- -bundle 1). 

python setup. py py2exe --bundle 1 



o bien podemos anadir un nuevo argumento options a la funcion setup 
que indique el valor a utilizar (option bundle_f iles), de forma que no 
tengamos que anadir el flag - - bundle cada vez que usemos el comando 
py2exe: 

from distutils.core import setup 
import py2exe 

setup(name="Aplicacion de ejemplo", 
version="@. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http : //mundogeek . net/ tutorial -python/" , 

license="GPL", 

scrip ts=[ "ejemplo. py" ] , 

console=["ejemplo.py"] , 

options={"py2exe" : { "bundle_f iles" : 1}} 



Por ultimo podemos incluso prescindir de library.zip e incrustarlo en el 
ejecutable utilizando el argumento zipf ile=None 

from distutils.core import setup 
import py2exe 

setup(name="Aplicacion de ejemplo", 
version="0. 1 " , 

description="Ejemplo del f uncionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http : //mundogeek . net/ tutorial -python/" , 

license="GPL", 

scrip ts=[ "ejemplo. py" ] , 

console=["ejemplo.py"] , 

options={"py2exe" : { "bundle_f iles" : 1}}, 

zipf ile=None 
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